劉念,任佳鑫,韓曉藝,劉銘
(北京交通大學計算機與信息技術學院,北京100044)
近年來,隨著無線網絡、人工智能、大數據等技術的迅猛發展,各類物聯網應用不斷涌現,成為第五代移動通信網絡(5G)中主要支持的三大應用場景之一[1]。在物聯網應用范圍不斷擴大、設備數量飛速增長的同時,其所具有的安全問題也日益突出。一方面,由于無線網絡本身的開放性,使得惡意用戶能夠通過一定手段偽裝身份,獲取進入網絡的權限,進而干擾或破壞合法用戶的正常通信,嚴重威脅無線網絡安全。另一方面,隨著計算機技術的發展及密碼破譯技術的不斷升級,傳統的基于密碼協議或用戶身份信息的高層身份鑒別機制受到了越來越大的挑戰。因此,需要提出一種更可靠的設備身份識別方法,以保障無線通信過程中的信息安全。
射頻指紋,因其來自于無線設備內部的硬件差異,表征了設備本身的物理層特征,具有個體唯一性且難以篡改,可以作為識別不同無線設備的依據,受到了越來越多的關注[2-3]。構建射頻指紋的信號特征是從可識別信號中提取的。依據可識別信號所處狀態,可將射頻指紋分為兩類,即基于瞬態信號特征的射頻指紋和基于穩態信號特征的射頻指紋。
基于瞬態信號的射頻指紋技術,主要是指發射機開啟瞬間,信號發射功率從零上升到額定功率這一階段的信號變化特征。這部分信號不會攜帶任何與數據有關的信息,僅和發射機硬件特性有關,具有數據獨立性。由于瞬態信號的持續時間極為短暫,因此在進行指紋提取之前需要對信號起始點進行精確地檢測[4]。常用的起始點檢測方法有:門限檢測方法[5]、Bayesian階躍變點檢測方法[6]、Bayesian 漸升變點檢測方法[7]、方差軌跡法[8]、排列熵方法[9]等。初期的射頻指紋提取和識別技術的研究均圍繞瞬態信號開展??商崛〉男盘柼卣靼ㄋ矐B信號持續時間、頻譜特征、小波域特征、分形維數以及信號包絡等?;谒矐B信號特征的射頻指紋提取技術往往需要采用高精度設備進行高速信號采集,信號的捕獲和分離較為困難,故實際使用的難度較高。
基于穩態信號的射頻指紋依據的是穩態信號的變化規律,相比瞬態信號來說更容易獲取,特征也更穩定。得益于以上優點,近年來的研究焦點也逐漸轉向基于穩態信號的方案。具體可分為基于頻域特征的方法[10]、基于調制特征的方法[11]、基于非線性特征的方法[12]、基于其它變換域的方法[13-14]以及基于信號統計量的方法[15]??傮w而言,當前利用射頻指紋進行身份識別的研究主要考慮單一的通信方向,即側重于對用戶終端身份的鑒別[16-18],尚未考慮網絡中心節點可能遭到惡意入侵的風險。因此存在著嚴重的安全隱患。物聯網設備受限于自身硬件特征,結構相對簡單,計算能力不足,更容易受到偽裝成中心節點的惡意用戶的攻擊,安全隱患更為突出。為了解決該問題,本文通過研究通信雙方射頻指紋間存在的互易規律,提出了一種適用于物聯網場景的下行方向身份識別的方法。
圖1 展示了一種典型的數字發射機結構。基帶信號經過數字信號處理之后進入模擬電路部分進行調制,得到的射頻信號最終通過天線發射。信號調制由模-數轉換器、正交調制器、上變頻器、功率放大器等模擬電路完成。而射頻指紋即源于上述模擬電路中元器件的固有差異。

圖1 射頻指紋產生機理
在實際的生產、制造過程中,由于存在設備元件差異和硬件加工工藝誤差等,無線設備的電學參數和標準值之間存在著不可避免的容差。這些容差的存在,使得即使是同一廠商生產的同一型號的設備,也會存在某些細微的差別。這種硬件上的差異會對所發送的射頻信號產生不同的影響。因此,通過分析接收到的射頻信號,便可以提取出發射該信號的無線設備所特有的特征,這種特征被稱為射頻指紋。由于射頻指紋中所包含的特征僅由無線設備自身的固有硬件差異所決定,而與無線信號所承載的信息無關,因此可以用來識別無線設備,防止惡意用戶仿冒身份,實施攻擊行為。
現有的基于射頻指紋的設備身份識別方法僅針對單一的通信方向。即通信的一方若是想要驗證另一方的身份,便需要對其射頻指紋特征進行學習。若通信雙方均需要驗證對方身份,則需要雙方各自開展獨立的學習過程,以掌握對方的射頻指紋特征。在具體的物聯網場景中,上行通信方向的身份驗證,需要物聯網中心節點通過學習物聯網設備的射頻指紋來驗證其身份;反之,在下行通信方向上,物聯網設備若要驗證中心節點的身份,則也需要對中心節點的射頻指紋進行學習。
然而,這種傳統的設備身份識別方法需要基于一個重要前提,即進行通信的收發信機雙方都具有提取射頻指紋的信號處理能力以及對身份識別算法的學習能力。而在物聯網的場景下,通信雙方存在著電源續航、業務流量、存儲計算能力等多重不對稱性。物聯網中心節點具有較強的信號處理、運算能力,能夠完成對物聯網設備的射頻指紋提取和身份識別算法的學習,從而保障上行通信方向的通信安全。而結構簡單的物聯網終端設備難以勝任對物聯網中心節點的射頻指紋學習任務,因此在下行通信方向無法使用射頻指紋技術增強其通信的安全性。
針對這一難點,本文提出將物聯網設備所需完成的學習任務遷移到物聯網中心節點完成。具體地,通過研究通信雙方的射頻指紋之間存在的對應規律,發現基于無線信道的互易性,雙向通信鏈路的射頻指紋也具有一定的互易性。眾所周知,無線通信的上下行信道具有一定的互易性,主要表現在上下行兩個方向的信道響應具有相似的衰落特性、多徑特性。因此,時分雙工系統中可以利用某個方向上的信道估計結果進行另一個方向上的預編碼、波束賦形等操作[19]。類似的,通信鏈路的雙向加密也可以基于這種相似的信道統計特性來實現[20]。雙向通信鏈路在統計特性上的相似性實際表明了無線傳播環境、收發雙方的射頻電路均具有相似的特征。這從本質上保證了由收發雙方射頻電路所決定的射頻指紋也會具有一定的相似特性。需要注意的是,在實際通信過程中,收發雙方的射頻鏈路中的元器件可能存在一定規格的差異,從而對射頻指紋的互易性造成不同的影響。如收發雙方采用不同精度的數模轉換器會產生不同的量化噪聲,使用不同的采樣率也會造成射頻信號表示的差異。這類器件規格的差異是不互易的,但由于進行通信的收發設備是確定的,這類不互易的差異在信號的表示中通常是大尺度的、穩定的,因此可以通過對雙向通信的信號樣本進行學習來獲得,故收發雙方的射頻指紋在整體上仍具有互易性。

圖2 多對收發設備基于差分星座軌跡圖的射頻指紋
為了進一步驗證射頻指紋互易性,本文通過對軟件無線電設備HackRF One 進行信號樣本采集、處理,得到如圖2 所示的差分星座軌跡圖。由圖可以直觀地看出,不同組合的收發雙方間射頻指紋均存在上下對稱的鏡像特征。通過對10 個HackRF One 兩兩組合進行交叉實驗,發現基于差分星座軌跡圖的射頻指紋在通信雙方間均存在此類穩定的對應關系。證明了從根本上來說,基于無線信道的互易性,上下行方向上的射頻指紋也具有一定的互易性。簡單來說,射頻指紋互易性描述的就是通信雙方的射頻指紋間存在的某種穩定映射關系。通過利用這種互易關系,能夠在已知的通信一方的射頻指紋的情況下,施加一定的變換手段推出另一方的射頻指紋。以此為依據,本文提出了一種適用于無線物聯網的下行方向身份鑒別方法,以提高無線物聯網的安全性。
本文所提出方法的核心思想是,基于射頻指紋互易性,將下行方向物聯網終端設備的身份鑒別任務交由上行方向的網絡中心節點完成,以適應無線物聯網在設備能力、數據流量等多方面不平衡的特點。具體可分為兩個任務,一是設計射頻指紋變換網絡,將中心節點所收集到的終端設備的射頻指紋轉換成能夠反映中心節點自身身份的射頻指紋,也即實際終端設備視角的射頻指紋。二是設計射頻指紋分類器,對利用變換網絡生成的網絡中心節點的射頻指紋進行特征提取和學習。需要注意的是,以上兩個網絡的訓練任務均由該物聯網中的中心匯聚節點來完成。且在訓練完成之后,需要將訓練好的分類網絡的架構及參數安全下發給物聯網終端。在實際的通信過程中,終端設備只需在接收到中心節點發來的信號后,提取出射頻指紋,并利用訓練好的分類網絡對該射頻指紋所對應的中心節點身份的真偽做出判斷,即可實現下行方向身份鑒權的目的。
本文設計的下行方向身份鑒別網絡模型如圖3 所示。該模型主要分為兩部分,第一部分是基于自動編碼器(AutoEncoder)的射頻指紋互易變換網絡,第二部分是基于卷積神經網絡(Convolutional Neural Networks,CNN)的射頻指紋分類網絡。

圖3 物聯網下行方向身份鑒別網絡模型
射頻指紋互易變換網絡,作用是完成利用通信一方的射頻指紋產生另一方的指紋。該網絡主要由自動編碼器組成,包括一個編碼器和一個解碼器,編碼器GE用于對輸入指紋進行高維特征抽取,得到一個潛在向量z,解碼器GD用于利用潛在向量z 重構出一個射頻指紋。輸入的訓練集D={(X1,Y1),(X2,Y2),…,(XM,YM)}表示包含M對上下行兩個方向的射頻指紋的集合,其中XM表示終端設備的射頻指紋,YM為期望學到的與終端M相對應的物聯網中心節點的射頻指紋。通過訓練,該網絡能夠學習到收發雙方射頻指紋間存在的潛在對應關系,從而利用一方的射頻指紋生成另一方的射頻指紋。
射頻指紋分類網絡,是基于CNN 的二分類網絡。旨在通過有監督學習的方式,完成對射頻指紋特征提取的任務,實現對設備身份合法/非法性的判別。該CNN 網絡模型包括:兩個卷積層、四個ReLU 層、兩個池化層和三個全連接層。詳細的網絡參數設置如表1所示。

表1 基于卷積神經網絡的射頻指紋分類網絡詳細參數
為了使得所提出的算法能取得較好的實際應用價值,本文中的所有實驗數據均由真實環境采集獲得。具體地,考慮由10 個HackRF One 軟件無線電設備組成的物聯網應用場景。第一步,通過搭建相應的軟件無線電平臺,實現對藍牙信號的模擬收發,并按照10倍過采樣率完成信號的采集。第二步,對采樣數據進行數據處理,提取基于多差分間隔星座軌跡圖的射頻指紋。第三步,利用設計好的網絡模型進行相應的性能測試。為了更好地模擬真實應用場景,本文對數據集進行人工劃分,劃分原則為:每次任意選取一個設備作為非法中心節點,組成一個數據集。例如,數據集Abn1 對應著把1 號設備作為非法中心節點,其他設備作為合法中心節點。以此類推,得到Abn2,…,Abn10共十個數據集。每個數據集中,選取全部信號樣本的80%作為訓練集,20%作為測試集,進行網絡性能的測試。實驗使用的數據處理軟件平臺為MATLAB R2017b,神經網絡的訓練在PyTorch v0.4.1 框架上完成,并通過Adam 優化算法進行網絡優化,動量取值分別為β1=0.9,β2=0.999,初始學習率為0.0001,每一批次大小為128。
圖4 展示了部分利用射頻指紋互易變換網絡生成的圖像。其中real 表示真實采集到的射頻指紋,也即期望學習到的目標指紋;single-generate 和mix-gener?ate 分別表示利用單互易變換網絡、多互易變換網絡生成的重構指紋,即互易變換網絡最終的學習結果。兩種網絡的模型架構完全相同,區別之處在于輸入的訓練數據所包含的設備種類數。其中,單互易變換網絡意為進行通信的每一對收發設備都擁有自身獨立的變換網絡,輸入數據中僅包含這一對特定通信設備的信息。而多互易變換網絡則表示處于同一物聯網場景的多對用戶共用同一個互易變換網絡,其輸入數據中包含了多對通信設備的信息??偟膩碚f,兩種互易變換網絡各有所長。單互易變換網絡可以對多種不同的互易特征進行獨立學習,針對性更強;而多互易變換網絡能夠對互易特征相同的多組設備進行聯合學習,泛化性更強。

圖4 互易變換網絡生成的圖像和真實圖像的對比圖
通過與真實采集到的圖像進行對比可以看出,所設計的射頻指紋互易變換網絡能夠很好的學習到通信雙方射頻指紋之間存在的互易特征,實現了在已知一方射頻指紋的情況下重構出另一方射頻指紋的目的。

圖5 不同非法中心節點下分類網絡識別準確率
為了進一步驗證利用射頻指紋互易變換網絡生成的射頻指紋的質量,本文利用射頻指紋分類網絡對所生成的指紋進行身份識別。圖5 展示了分類網絡對真實采集到的數據(real)、單互易變換網絡生成的數據(single-generate)以及多互易變換網絡生成的數據(mix-generate)進行識別的結果。橫坐標表示不同設備作為非法中心節點的情況,縱坐標表示相應的識別準確率。
由圖5 可以看出,一方面,分類網絡對實際采集到的真實數據(real)的分類精度最高能達到100%,最低不小于95%,說明該分類網絡具備識別物聯網中設備身份是否合法的能力。另一方面,無論是利用單互易變換網絡(single-generate)還是多互易變換網絡(mixgenerate)生成的數據,都能夠達到與真實數據的分類誤差不超過2.5%的分類精度。由此可以說明,所設計的射頻指紋互易變換網絡能夠學習到通信雙方射頻指紋間的互易特性,具備對上下行鏈路的射頻指紋進行轉換的能力。此外,在所有數據集上,基于單互易變換網絡生成的數據都能夠取得比基于多互易變換網絡生成的數據更高的識別率。
圖6 展示了對真實采集到的數據和利用多互易變換網絡生成的數據在不同信噪比下的分類準確率曲線。圖中橫坐標代表信噪比,縱坐標代表分類準確率。整體來看,隨著信噪比的增加,兩條曲線的分類準確率都呈現增加趨勢。這是由于信噪比越高,信號的接收質量越好,射頻指紋中包含的干擾和噪聲的影響越小,因此有利于提高分類效果。當信噪比大于等于20db 時,兩類數據均能取得高達100%的分類準確率。而在信噪比為10db 時的較低信噪比情況下,兩者也能達到不低于92%的分類準確率,且基于多互易變換網絡生成的數據整體的分類性能要略優于真實采集到的數據。
物聯網由于受到設備硬件資源和網絡資源的限制,潛在的通信安全問題愈發突出?,F有的基于射頻指紋進行設備身份識別的方法僅能支持單向身份識別,未充分研究網絡中心節點身份存在非法的風險,因而無法很好的滿足物聯網的需求。針對上述不足,本文提出了一種物聯網場景下基于射頻指紋的下行方向設備身份鑒權方案。核心思想是通過利用通信雙方間射頻指紋存在的互易特性,將下行方向的身份識別任務轉移到上行方向來完成。該方法充分考慮了物聯網場景中終端設備及網絡中心節點間的多重不對稱性,具有很好的實際應用價值。實驗結果表明,所提出的方法能夠達到很好的識別性能,彌補了傳統單向鑒權中存在的安全漏洞,進一步提高物聯網安全。