張育瑜,趙 磊 ,郭文彬*,彭 濤 ,王文博
(1.北京郵電大學 信息與通信工程學院,北京 100876;2.通信網信息傳輸與分發技術重點實驗室,河北 石家莊 050000)
無線電監測是一個討論多年的熱門話題,它能更有效地實現可用頻譜資源的監測,增強頻譜資源的管理,具有很強的應用價值。盲信號識別是無線電監測中一項重要的識別技術,它負責從一段頻譜中提取出信號信息,在缺少足夠的先驗信息前提下,及時發現違法、異常和干擾信號,凈化頻譜資源環境,同時,它能夠秩序化地利用空閑頻段,實現頻譜資源的高效利用。
大數據背景下的無線電監測需要考慮諸多問題[1]。一方面,基于網格化節點[2-4]監測產生的海量原始數據需要進行數據分析[5];另一方面,對于數據挖掘出的結果需要進行分布式存儲[6-7]。文獻[4]給出了海量數據背景下無線電監測的功能實現、平臺構建和結果存儲的一種方案,該方案缺乏對原始數據的全面分析,也沒有結合諸多成熟的識別技術挖掘出完備的知識單元,使得存儲數據含有大量冗余信息,不能很好地解決無線電監測所面臨的問題。西華大學借助產學研聯合實驗室開展的無線電智能化監管研究探索了共享型無線電監測技術融合體制[3],一定程度上實現了智能化無線電監測平臺,但還是缺乏對無線電監測數據的深入分析以及對原始數據的提純。針對大數據背景的無線電監測數據處理需要能夠結合相應識別算法對原始數據進行深度挖掘,提純出有價值的知識信息替代原始數據[8],并對知識信息進行結構化梳理、規范化存儲,進而實現機器智能化認知識別結果。結構化知識是大數據處理的高效方法[9],知識圖譜作為一種結構化知識的架構,被廣泛應用在涉及大數據處理的各個領域[10-12],取得了不錯的成果。
結構化知識是核心[13],識別算法是關鍵。本文一方面在無線電監測平臺上引入知識圖譜架構,并結合ITU無線電監測內容[14],全面梳理盲信號識別的知識,構建知識間的拓撲結構,規范存儲模板;另一方面,重點介紹了無線電監測中的盲信號識別流程,結合改善多種盲信號識別算法進行數據分析與挖掘,利用得到的知識實體對構建的盲信號知識模板進行知識填充,最終利用工程技術實現智能可視化無線電監測平臺。第2節介紹了基于知識圖譜架構的盲信號識別;第3節進行實驗結果分析;第4節給出結論。
無線電業務的發展以及監測設備的增多,使得盲信號識別呈現出大數據的特點。盲信號實時監測平臺所依賴的原始數據主要有以下3點特征[13]。
① 基于時空頻的多域特性。一段頻譜數據的標簽信息包括監測時間、監測地點和監測頻段以及監測設備等。智能化的監測平臺需要能夠從這3個維度展示識別結果。
② 基于多平臺的同構異構數據類型。由于監測設備多樣化,接入監測平臺的數據類型復雜多樣。這其中不僅包含不同設備對同一地區同一頻段同一時間的原始數據,還包括除了頻譜掃描數據之外的IQ數據、AD采樣數據以及音頻、測向定位數據等[15]。
③ 數據存在冗余,不利于批量存儲。原始數據不能作為知識實體被機器所識別,無法實現智能化平臺,需要結合相關算法,抽取出有用的知識實體進行存儲。
針對上述特征,通過知識圖譜的構建,賦予原始數據時空頻屬性、節點屬性和數據類型屬性等,對數據進行標識;利用頻譜感知算法、信號識別算法挖掘提取有用知識實體。
盲信號知識圖譜的核心在于形成結構化的知識,并采用高效的方式進行存儲。從構建知識圖譜的流程[12]以及知識庫最終的呈現形態2個角度進行闡述。圖1展示了知識圖譜的構建流程。
原始數據主要分為結構化數據和非結構化數據2部分。結構化數據中的歷史模板可以作為知識抽取的先驗信息。知識抽取主要從非結構化數據中提取知識并生成知識實體,抽取出的知識需要與結構化數據知識進行知識融合,融合過程中利用時間、空間、頻段和節點ID生成知識的唯一性標簽,并對重疊實體部分進行消歧處理,初步形成盲信號知識的拓撲結構,并利用知識計算生成新知識,與原知識拓撲結構融合形成完備的知識圖譜并存儲至知識庫,通過調度結構化知識庫的數據進行智能化平臺展示。

圖1 盲信號識別知識圖譜構建流程Fig.1 Blind signal recognition knowledge map construction flow chart
知識庫是知識圖譜的核心成果,它包含2個要點:模式層與數據層。模式層定義知識實體內的屬性、關系,實體間的層級結構,盲信號識別知識庫的模式層定義了知識入口類、背景知識類、實時信息類和單個信號類4大類;數據層則是模式層的具體實現,是數據呈現的一種方案。圖2給出了盲信號識別知識庫的模式層結構。

圖2 盲信號識別知識庫模式層Fig.2 Blind signal recognition knowledge base pattern layer
知識入口類包含3個知識單元:時間、空間和頻帶,它是所有知識的共有屬性。時間指要檢索的起始時間,空間指要監測的不同地理位置,頻帶指要檢索的頻段范圍。知識入口類中的屬性是每個知識實體的標簽,將這些屬性加上監測節點ID,生成唯一性標識ID。背景知識類包含3個子類:注冊信息類、硬件信息類和信號模板類,它可以為知識挖掘和推理提供豐富的先驗信息。實時信息類包含背景噪聲功率、電磁波功率、頻譜圖和信號個數等7個屬性,實時信息類用于收集實時頻段中包含的知識單元。單個信號類包含3個子類:靜態信息類、實時變化類和知識推理類,單個信號類是對單個信號詳細屬性的歸類。圖中的類定義了所有知識實體的共有屬性,每個實體對象會存在屬性差異,類之間的箭頭顯示了類的層級結構,對象指向的箭頭顯示該對象的屬性,屬性有實體屬性和類屬性2種。
原始數據的頻譜是多信號共存的,不能直接用于調制信號識別,需要將需要識別的每個信號分離出來,再逐一識別。文獻[16]提出一種基于迭代檢測的寬帶頻譜自適應感知算法,它能夠根據每個頻點的統計平均值設置判決門限,頻點判決結果能夠更準確。
算法思路:根據大數定理,當統計次數足夠多時,每個頻點的幅值大小服從高斯分布,據此可統計每個頻點的M次的平均值作為判決量,再預設檢測率與虛警率,得到每個頻點的判決門限與該頻點平均信噪比以及頻段底噪功率的關系,通過迭代計算得到頻段底噪功率進而得到每個頻點的判決門限。
考慮到M越大檢測率越高,但M太大會影響感知時間以及算法的時間復雜度,原算法再對M進行迭代計算找到合適的值。框架中實時數據以流的方式存在,只需要設立全局變量存儲每次數據疊加的結果,就能達到不斷增大M的效果,隨著監測時間的增長,識別結果就會越準確。故在將本算法應用于盲信號識別框架中,只迭代計算判決門限,大大減少了算法時間復雜度。圖3展示了算法流程。

圖3 基于迭代檢測的寬帶頻譜感知算法Fig.3 Wideband spectrum sensing algorithm based on iterative detection
先初始化合適的M與判決門限,得到噪聲功率,計算出判決量:
(1)
式中,n=0,1,2,...,N-1表示N個頻點;Ynm為第n個頻點功率值大小。根據信號底噪、每個頻點信噪比以及設定的檢測率、虛警率進行判決,并與上次判決結果進行比較,迭代計算直至滿足要求,一方面輸出結果,另一方面繼續增加M,重新計算。通過改善基于迭代檢測的寬帶頻譜自適應感知算法,識別出頻段中每個信號的帶寬信息、背景噪聲功率、信號個數、頻段使用率以及空閑頻段信息。
由上節算法能夠理想濾波出單個信號進行調試模式識別。模擬信號與數字信號的序列統計特征值存在較大差異,通過非線性變換法,二次小波變換法都能很好地區分開來。考慮到工程的時效性,本框架采用非線性變換法進行處理。設信號序列s(t),t=1,2,...,N。非線性變換得到Q(i)序列:
Q(i)=s2(i)-s(i-1)s(i+1)。
(2)
再對Q(i)進行差分處理得到P(i):
P(i)=Q(i+1)-Q(i)。
(3)
設置合適的門限,通過計算P(i)的方差即可進行模數判決。
識別的模擬信號有AM,DSB,FM,CW,LSB,USB六種類型。采用文獻[20]中所提出的3個特征參數進行分類,利用包絡變化特性特征值gmax區分出AM,DSB信號;利用譜對稱性特征參數P區分出LSB,USB信號;利用序列點瞬時幅度統計特性sdp區分出FM,CW信號。
第1個特征參數gmax為:
gmax=max|FFT(Acn(i))|2,

(4)
式中,Acn(i)是該段信號第i(i=1,2,...,N)個歸一中心化的瞬時幅度;A(i)為該段信號第i(i=1,2,...,N)個瞬時幅度。
第2個特征參數P為:
(5)
式中,X(i)序列為采樣序列X的FFT;fcn+1代表載波所對應的點數。
第3個特征參數sdp為:
(6)
式中,An(i)>a表示信號歸一化幅度An(i)大于門限a,即所謂的強信號;C為強信號的個數;fNL(i)為瞬時非線性相位。
在實驗中,使用本文提出的知識圖譜架構盲信號識別系統對實時環境進行頻譜監測,搭建框架語言采用C++與QT結合的方式,后臺存儲部分采用Redis數據庫集群。通過結構化知識庫進行高效的數據交互操作,實現智能化的無線電頻譜監測平臺[17]。本系統采用如圖4所示的系統架構[18]。

圖4 智能監測平臺架構Fig.4 Intelligent monitoring platform architecture
后端部分包括數據部分、服務集群、服務管理中心以及反向代理集群。數據部分包括數據庫集群、傳感節點網絡以及傳感節點管理中心;服務集群主要包括用戶服務、產品服務兩大類;服務管理中心集群負責監控管理服務調度的負載均衡,反向代理服務器用于設立網關和服務管理中心的負載均衡,從而實現高可用的無線電監測管理平臺[19]。
實驗數據的采集節點使用安捷倫公司生產的RF Sensor,覆蓋30 MHz~6 GHz的帶寬,可調數字中頻帶寬為20 MHz,支持輸出I/Q(同相正交)時間序列和快速傅里葉變換(FFT)數據流,同時提供遠程控制的可編程應用程序接口(API)[20]。所監測頻段每間隔2 s刷新一次,每次返回10 000個實時數據點,實時分析結果每隔30 s刷新一次。實驗檢測地點為北京市海淀區北京郵電大學新科研樓6樓,檢測頻段為90~110 MHz頻段,檢測次數為100次。90~110 MHz授權合法信號的信息一部分來自于北京廣播網,另一部分來自收音機實地實測數據。
圖5為90~110 MHz頻段的部分電臺監測100次,得到統計的調制類型識別結果,其中,后6列數字表示識別成相應調制格式的次數。

中心頻率/MHz電臺名稱AMFMDSBCWLSBUSB90.5中國國際廣播電臺環球資訊1189000091.5中國國際廣播電臺EasvFM196200192.3外語廣播097012095.4故事廣播193000698.2青年廣播098200099.6中國交通廣播0990100100.6新聞廣播01000000101.8都市之聲(四套)0970201102.5體育廣播01000000
該頻段的信號調制類型為FM,所有信號識別出FM信號的正確率為96.56%,達到了較高的識別效果。識別成AM的概率為1.33%,識別成其他信號占2.11%。上述識別的方式需要首先經過盲信號寬帶頻段的預處理,理想濾波出相應頻段的單個信號,所以識別效果不僅取決于調制識別算法,也取決于頻譜感知算法對信號帶寬、中心頻率等的識別精度。實驗分析中,對中心頻率的識別結果也進行了評估,達到了優良的識別準度,對中心頻率為90.5 MHz的信號進行100次測量,得到平均值為90.503 MHz,方差為0.16。
利用構建的知識庫,搭建出了一套智能化的可視化監測系統,部分可視化界面如圖6所示:圖6(a)中通過該界面能夠進入單個信號的實時監測。圖6(b)包括01數據流以及解碼內容。圖6(c)包括信號個數、噪聲功率、電磁波功率、頻段使用率和空閑頻段等實時信息。圖6(d)包括頻道占用度、碼元速率、調制方式和干擾類型。圖6(e)包括背景噪聲功率、電磁波功率、頻段使用率和空閑頻段。

圖6 智能可視化平臺Fig.6 Intelligent visualization platform
本文提出了大數據背景下利用知識庫構建智能化頻譜監測與管理平臺的新思路,梳理并結構化了盲信號識別過程中的知識實體,并結合實際,利用相關算法提取了這些知識。實驗結果驗證了相關算法的準確性,可視化系統也進一步驗證了框架的智能化特性,達到了優良的效果。