蔡立偉,梅 芳
(國家無線電監測中心云南監測站,昆明 650031)
近年來,伴隨科技高發展給我們帶來便利的同時,也給某些心懷不正的人以可乘之機,利用無線電進行考試作弊成為不公平考試的重要手段。現階段,考試無線電作弊手段日趨先進,由原來的單純發送語音向發送文字轉變,由模擬信號開始向數字信號轉變。作弊信號發送時間更短,用于作弊的終端設備更微型化,由原來的錢包式、腰帶式,演變到現在的手表式、橡皮式。作弊人員變得更加專業化、團隊化,作弊成功率更高,造成的社會影響更惡劣,嚴重破壞考試公平性、公正性,給考試無線電安全保障工作帶來嚴峻挑戰。
面對嚴峻的無線電作弊新形勢,僅依靠人工或者半自動的監測發現作弊信號,不僅效率低、實時性差,容易漏掉作弊信號,而且對數字信號的判別解碼基本束手無策,所以必須由監測設備自動工作掃描識別,才能迅速、準確地識別考試無線電作弊信號,為逼近查找發射作弊信號源爭取寶貴的時間。在考試無線電保障過程中,最關鍵的是對無線電作弊信號的識別。[1]
考試無線電識別系統通常在自動模式下工作,可以大大節省人工成本,提高工作效率,而且設備易攜帶、環境適應性強。
通常系統偵測設備為雙通道接收機,偵測設備天線接收到信號后,將信號通過功分器分成兩路:一路掃描通道負責捕獲新出現的信號,一路分析通道負責信號解調和解碼。信號偵測設備開機后自動采集背景信號,形成環境樣本庫;用戶也可自己設置門限,對超過門限的新信號進行重點監測識別。偵測設備搜索到可疑信號后,發送至云服務器進行性質判定,并將結果發回至偵測設備控制端進行顯示。如果識別的結果為作弊信號,則設備保存該頻點信號,并持續關注監測該頻點信號。
對于新出現的模擬信號,則解調出音頻,通過音頻語音識別其內容,如果內容中包含疑似作弊關鍵字則視為作弊信號,內容為正常則忽略;對于新出現的數傳信號,對其解碼出文字內容,并進行關鍵字匹配識別,根據內容判別其是否為作弊信號。對于判定為作弊信號的頻點,控制終端告警,突出顯示。對于自動判定不正確的信號,可將其作為“誤報信號”反饋回云服務,幫助改善自動判定的準確性,也可將此功能設為手動方式,人工判斷可疑信號是否為作弊信號。如圖1所示。

圖1 作弊信號識別原理圖
通常考試無線電作弊系統對采集的新信號進行調制識別,將信號分為模擬調制和數字調制兩類,然后對兩類信號進行識別,并對信號內容進行解碼,最后判斷解碼內容是不是作弊信號[2]。
當系統判別為語音信號時,首先對語音信號在云端語音識別引擎進行在線識別,將語音信號轉成文本內容,然后對文本的關鍵字匹配并輸出識別結果。如圖2所示。

圖2 語音信號識別流程圖
(1)語音信號識別原理。語音識別是通過計算機算法對語音信號進行識別,并將其轉換為文本或者指令的技術。語音識別系統首先對收集到的語音信號進行預處理,預處理包含信號采樣濾波、減少個體發音差異,消除環境引起的噪聲影響等過程,預處理完成后系統提取語音信號特征,然后建立語音識別模板。系統根據對應的語音識別模型,用保存在服務器中的語音模板和預處理過的語音信號特征進行比較,按照算法設定的查詢和適應目標策略,尋找到與輸入語音匹配的最適合模板,根據匹配的模板計算出識別結果[3]。從語音識別過程可以看出,識別結果與選擇合適的語音模型有很大的關聯。語音識別系統構建包括訓練和識別,把大量的音頻、語言數據庫進行信號處理和數據挖掘,從而建立系統的聲學模型和語言模型;識別是對接收的實時語音信號進行自動分析,通常系統可以自適應學習糾正聲學模型和語音模型,從而不斷提高識別系統準確率。如圖3所示。

圖3 語音信號識別原理圖
(2)語音識別算法。語音識別算法是語音識別技術的關鍵。語音識別系統聲學模型建模后,把語音輸入變化成聲學的數學函數輸出,按照統計學計算出語音信號的聲學概率。語言模型在聲學模型計算得到語音序列后,從系統的文字序列中找出概率最大的字符串序列,從而實現對語音信號的識別。下式為語音識別算法的經典基本框架公式:

式中,W 代表文字序列;Y 代表語音輸入;P(Y|W)是文字序列出現語音的概率,代表語音識別中的聲學模型;P(W)是出現這個文字序列的概率,代表語音識別中的語言模型。
當系統判別為數字信號時,通過特征提取獲取信號的調制方式、通信體制等相關調制參數,并對其進行解碼,解碼后對內容進行關鍵字和特征匹配,判別內容是否為作弊信息。主要流程包括:
(1)信號預處理:包括帶通信號采樣、模數A/D 轉換、對信號進行濾波。
(2)特征提取:從原始信號中通過變換獲取信號特征參數。通常采用循環譜、高階統計量和小波變換等方法對數字調信號進行特征提取[4]。
(3)分類識別:特征提取后對信號進行分類識別,選擇判決方法和分類器結構對識別結果影響很大。現如今主流的信號調制方式分類采用決策理論方法或基于統計模式方法,通常使用統計模式方法較多[5]。
(4)解碼:信號調制方式識別完成后,需要相應的解碼器或者解碼算法實現對信號進行解碼,解碼出信號內容。
(5)關鍵字匹配:對解碼后的內容進行關鍵字匹配識別,根據作弊信息特征判別作弊信號。作弊信號通常為A,B,C,D 或者1,2,3,4 等報送內容,具有明顯的特征,可根據這個特征進行判別。

圖4 數字信號調制方式識別流程
市場上作弊設備層出不窮,對從圖5可以看出現階段常見的作弊設備型號主要是NF6、云六、TTO、南極光、Sunlips、云八、TK 等。圖6、圖7是現階段在考試保障中發現的典型作弊信號頻譜圖,作弊信號主要調制方式是2FSK 和LORA 信號。隨著技術發展,作弊設備發送的作弊信號頻段、信號類型也會變化,需不斷對作弊信號偵測識別系統進行迭代升級。

圖5 主流作弊設備頻段分布及調制方式

圖6 2FSK調制作弊信號頻譜圖

圖7 LORA調制作弊信號頻譜圖
本文根據對各大廠商考試無線電作弊信號的監測采集、信號識別、解碼等工作流程進行研究,闡述了作弊信號識別原理相關的技術算法,對掌握和研究無線電作弊信號識別方法有一定參考價值。面對技術不斷發展的作弊信號,需要不斷改進和升級考試無線電偵測系統的識別算法。