瞿珊瑚,劉宏波,張 旭
(海軍工程大學 電子工程學院,湖北 武漢 430033)
隨著通信技術的快速發展,各式新型通信電臺相繼出現。為滿足各式通信電臺的語音信號和報文信號的采集需求,提出一種電臺音頻采集管理系統總體技術方案[1]。由于電臺接收信號一般為人工操作,工作人員必須長期保持高度集中的工作狀態,無法保證不會出現誤譯、漏譯的情況。因此,無論接收的話音信號還是報文信號,人工識別度與準確度都會受到影響,繼而影響信息傳遞的可靠性。于是,設計一款電臺外接的電臺音頻處理終端,當終端與電臺相連時,通過PC端應用程序實現自動采集、記錄、識別及回放接收到的音頻信號,以有效提高信號接收準確率。系統中依靠處理終端對接收到的音頻信號進行實時采集,并上傳至數據存儲服務器,最后通過網絡將接收到的音頻數據傳至管理系統進行統一存儲及處理。系統一方面可不再依靠純人工進行收聽記錄,客觀保證音頻采集數據的真實性,提高收聽信號的準確度;另一方面,引入網絡架構可將不同的數據存儲到服務器,在不同地區的人員可通過訪問服務器對數據進行處理,實現多用戶端遠程管理和實時數據共享。
1.1.1 用戶需求
報務人員需求。目前,電臺信號接收仍采取人工值守的方式,一臺電臺需配備一名監聽人員,無法對多臺設備進行監聽,且長時間處于工作狀態容易出現漏聽、漏記現象。借助電臺音頻處理終端進行自動接收及記錄,使用其相應的應用程序對數據進行實時處理分析,輔助完成日常工作,可提高工作效率和準確率。
監管人員需求。報務人員的記錄為主觀監測,無法保證記錄信息的真實有效性,而通過終端接收并實時數據上傳至服務器端存儲記錄可對數據進行遠程監管,及時調用數據信息進行數據匹配和分析。
1.1.2 功能需求
電臺作為實時傳遞信息的手段之一,信息接收環節必須做到高效且準確。電臺音頻采集管理系統對多臺電臺接收的音頻信號進行集中統一管理,其功能如圖1所示,主要包括電臺音頻處理終端、數據服務系統和用戶端3大部分。

圖1 系統功能
電臺音頻處理終端是整個功能系統最原始的底層服務,其功能是對電臺接收到的音頻數據進行數據處理。數據處理包括對音頻信號的采集與回放、Morse音頻信號處理以及語音信號識別處理。
用戶端的主要功能是用戶信息管理、數據監測、數據管理以及數據上傳,其中數據上傳的功能是將采集到的所有數據信息同步上傳至數據服務系統。
數據服務系統依托服務器可統一管理多個用戶端上傳的所有數據信息,再通過瀏覽器和客戶端完成對服務器中的數據信息訪問。瀏覽器依托互聯網實現遠端數據交互,客戶端則依托專用網絡建立連接實現前端界面數據交互。
根據用戶需求和功能需求分析,對電臺音頻采集管理系統的技術方案流程進行簡要描述。利用設備采集音頻信號,通過設備功能模塊,對各種信號處理后將數據傳至PC機實現數據采集,而應用程序對采集的數據進行記錄、存儲、顯示及監測,通過用戶端將數據上傳至服務器,將電臺接收到的音頻信號數據經客戶端訪問進行統一管理,也可通過瀏覽器對服務器進行訪問,實現跨平臺跨系統的共享數據。電臺音頻采集管理系統工作原理如圖2所示。
電臺音頻采集管理系統工作原理。
(1)電臺音頻處理終端是為滿足通信電臺音頻信號采集的需求,針對各類通信電臺進行接口匹配,實時電臺采集語音信號,并進行數據采集和封裝上報的一款設備。利用軟件無線電技術,實現音頻信號的采集與存儲回放,保證語音的低失真度,并針對采集到的語音信號和Morse音頻信號分別進行自動識別處理。

圖2 電臺音頻采集管理系統工作原理
(2)用戶端是電臺音頻處理終端與PC機通信的橋梁,用戶通過PC端應用程序,傳輸及處理接收經電臺音頻處理終端處理后的數據,主要完成數據通信、數據記錄以及數據上傳等功能。
(3)數據服務系統借助網絡服務器,實現對電臺音頻數據的存儲和網絡數據服務,利用客戶端與瀏覽器訪問數據并實現遠程共享數據信息,同時可以將多個用戶端上傳的電臺數據信息進行統一存儲和調用處理。
訪問網絡數據服務采取的是C/S和B/S混合結構[2]。
基于B/S架構設計開發瀏覽器與服務器之間的用戶系統。利用Internet網絡訪問瀏覽器是遠程監測和共享數據的有效途徑,用戶通過瀏覽器向web服務器提出訪問請求,并對服務器返回的結果進行顯示和處理,其中返回的結果可為電臺實時接收到的音頻數據,也可通過回放功能調用存儲的音頻進行數據處理,以web方式訪問服務器,采用網頁嵌入播放器控制的方法實現實時在線播放。該架構主要適用于網絡性能好的開放平臺,信息共享度高、可維護性高、操作便捷,因此本架構僅用于監聽人員遠程訪問web服務器對訓練結果進行評估。
基于C/S架構設計開發建立在局域網專用網絡中,通過專用服務器提供連接和數據交換服務,經局域網訪問客戶端,實現一對多電臺音頻采集管理,安全性更高,客戶端響應速度快,實時性好。該架構適用于實時采集音頻數據且用戶穩定安全性要求高的環境,可應用于輔助監聽人員的日常監聽工作,自動接收電臺音頻信號,為實現電臺無人值守提供了可能。
根據電臺音頻采集管理系統的工作原理,對系統接口連接方式進行說明。系統接口連接示意圖如圖3所示。電臺音頻處理終端的對外接口包括以太網口、音頻接口、電源接口、USB接口以及耳機/話筒組接口。其中,USB接口用于傳輸Morse信號數據;網口1為數據上傳接口,用于與服務器傳輸網接口點連接;網口2為系統PC機接入口,用于PC機向終端加載參數及采集數據。網口接口單元均為接收采集終端上報的音頻數據、時間、位置數據以及參數信息。

圖3 電臺音頻采集管理系統接口連接示意
通過對電臺工作現狀的分析,確定開發一款電臺音頻處理終端設備,其整體設計結構如圖4所示。
電臺音頻處理終端分為音頻采集單元、存儲單元和控制及處理單元。其中,音頻采集單元主要完成從電臺接收到的音頻信號的電平轉換和語音編解碼操作;存儲單元則是存儲接收到的音頻信號以及處理后的信號數據,并實現回放功能;控制及處理單元包括Morse音頻信號處理和語音識別兩個功能性模塊,將接收到的Morse音頻信號數據傳輸給處理單元中的Morse音頻信號處理模塊,將音頻信號轉換成數字信號供PC端應用程序進行識別譯碼顯示,接收到的語音信號則轉接給語音識別模塊,將語音信號自動轉換成文本文件存儲并記錄下來。

圖4 電臺音頻處理終端設計結構
電臺音頻處理終端整體由軟件及硬件兩大部分組成,包含三大功能模塊,分別為音頻采集與回放、Morse音頻信號處理和語音識別。根據電臺音頻處理終端設計原理,電臺接收的音頻信號經過外接設備終端處理后再傳輸給PC端應用程序進行接收顯示,接收到的音頻信號通過以太網口將數據傳輸給處理終端中的采集和回放模塊,方便操作者再次收聽確認接收到的信息是否完整。根據應用需求,對電臺音頻處理終端的三大功能模塊結構進行設計,各個功能模塊之間相互獨立,具體結構如圖5所示。

圖5 模塊結構設計
從穩定性、擴展性以及可維護性高的角度出發,將手工拍發的Morse音頻信號即時處理、產生的大量音頻數據長期存儲和回放以及語音信號離線識別3種業務數據,以功能模塊進行拆分。基于USB HID設備協議設計Morse音頻信號處理模塊,在原有的報務訓練盒[3]的硬件基礎上進行改進,并新增Morse音頻信號識別電路實現Morse自動識別功能。由于Morse音頻信號處理模塊無法將所接收到的Morse信號進行記錄回放,且語音信號無法接收記錄,因此利用軟件無線電平臺對音頻信號實現采集和回放功能。語音識別功能則是采用科大訊飛核心技術的離線識別模塊[4]來實現。各個功能模塊相互獨立,使得單個模塊故障或缺陷只影響該模塊功能,而其他功能模塊可正常使用。此時,只需針對該模塊進行修改維護,在產品升級時僅更新功能模塊,提升了整個終端設計的擴展性和可維護性。
針對現有的電臺接收采集音頻信號的技術分析,選擇利用軟件無線電平臺進行實時信號的記錄收集與顯示。軟件無線電平臺可將接收到的信號采集下來,通過接收電臺的硬件實現直接下變頻和A/D轉換,輸出的數字信號在上位機軟件中進行基帶的波形處理,從而完成音頻信號的采集與回放,再結合設計的Morse識別模塊和語音識別模塊對接收到的音頻信號進行分流處理。
采集和回放功能可有效提高信息接收準確度,解決了人工值守可能存在的漏聽現象。由ZYNQ-7030 SoC+AD9361構建的通用軟件無線平臺[5]簡單、易操作、擴展性強;利用湖南智領通信軟件無線電教學軟件(KZ-SDR-IDE)完成音頻采集與回放模塊設計,實現音頻信號采集與回放功能,實時觀測信號的頻譜和時頻圖。
(1)采集實現流圖如圖6所示。“音頻信源”及“文件信宿”放置工作區,編輯模塊參數,完成音頻信號的采集與文件存儲功能。“瀑布圖”“頻譜儀”及“眼圖”應用于對采集到的音頻信號的分析處理,分別顯示了采集到的音頻信號在時頻域、頻域及時域上的數據特征。

圖6 音頻采集實現流圖
(2)音頻回放實現流圖如圖7所示。“音頻文件信源”用于讀取存儲在文件夾中的音頻文件;“音頻信宿”用于對音頻文件進行播放,即訪問的文件信源輸出到音頻信宿(即聲卡),同時利用“瀑布圖”“頻譜儀”及“眼圖”分別對回放文件的時頻、頻域及時域進行特征數據顯示,以便后期對數據進行分析處理。

圖7 音頻回放實現流圖
Morse音頻信號處理模塊采取USB HID技術進行開發,設備上配置了電鍵、耳機以及麥克風接口,用于實現耳機、麥克風、電鍵和PC機之間的接口轉換和數據格式轉換[6]。該硬件模塊采取免驅動模式使整個系統更加簡潔,利用Windows系統自帶的HID類驅動程序進行設備識別,建立相應的HID協議作用于PC機,控制USB設備進行數據傳輸通信,實現實時電鍵信號的采集、電報音頻信號識別以及USB聲卡發聲。由于單片機、聲卡等主要芯片都采用低功耗芯片,+5 V電源可以滿足要求。該模塊可以通過USB與PC機相連,實現供電。
Morse音頻信號處理模塊的基本設計如圖8所示。利用USB HUB芯片將USB信號分為兩路:一路作為USB接口芯片和單片機構成的控制電路與PC機之間通信的通道;一路作為USB聲卡和PC機交換控制、音頻流數據的通道。
(1)作用于控制電路的通道:USB接口芯片將接收到的數據交由單片機進行處理,其中單片機的時鐘信號由晶振提供。電鍵的鍵控信號通過電鍵接口傳遞到電鍵預處理電路,進行消除抖動等操作后,一方面為保證電鍵聲的實時性,直接采取控制音頻信號發生器的方式,經混合放大后輸入USB聲卡進行發聲;另一方面將預處理后的電鍵信號交給單片機進行實時采樣,采樣數據通過USB總線傳給PC機進行識別處理。
(2)作用于USB聲卡的通道:聲音信號通過音頻信號混合放大電路與電鍵敲擊聲迭加,產生的音頻信號經過聲卡處理后送到耳機口;從麥克風接口接入的Morse音頻信號經放大后進行有效值檢測,通過比較器轉換成數字信號送入單片機,信號數據經USB總線傳輸給PC機進行處理,同時音頻信號 經USB聲卡傳輸到耳機供人耳收聽。

圖8 Morse音頻信號處理模塊基本設計
電臺音頻處理終端將接收到的音頻信號中的語音信號數據傳輸至語音識別模塊中進行處理,語音識別模塊則是采用科大訊飛核心技術的離線識別模塊XFMT101,使得終端可在離線條件下對語音信號進行識別。
語音識別的一般流程如圖9所示。

圖9 語音識別流程
語音識別過程[7]是將輸入的語音數據送入特征提取模塊,再通過語音解碼模塊對提取的特征數據進行解碼,轉換成對應的文本輸出。語音解碼過程則是通過調用聲學模型、字典以及語音模型進行數據匹配,匹配度最高的最優路徑即為最優語音識別結果。
離線識別模塊XFMT101是科大訊飛推出的初級智能語音方案,同時支持語音識別、語音合成以及語音播放等多種語音功能[8],支持UART作為通信接口,主要特點是功能豐富、接口簡單,可以廣泛應用于多種智能硬件領域。根據電臺實際運用場景,該模塊可為電臺音頻處理提供便捷、實用、可靠的離線語音識別解決方案。
本文提出了一種電臺音頻采集管理系統總體技術方案,根據系統需求對系統進行技術方案概述,并對其核心部分電臺音頻處理終端框架進行設計。利用通用軟件無線電平臺設計音頻信號采集回放功能模塊,結合USB HID協議設計免驅動的Morse音頻信號處理模塊中的自動識別模塊,實現了對Morse音頻信號的自動識別,并基于科大訊飛的離線語音識別模塊形成了完整的電臺音頻處理終端。本文設計的電臺音頻處理終端可適應多種電臺,離線或在線對電臺接收的音頻信號進行處理,將各硬件功能模塊與PC端應用程序相配合,利用軟件無線電平臺對采集的音頻信號進行存儲記錄處理,可有效避免電臺人工值守時出現漏記、聽不清等問題,提高接收信息的有效性和可靠性,同時利用Morse音頻信號處理模塊和語音識別模塊分別對采集到的Morse信號和語音信號進行自動識別,并結合人性化的PC端應用程序使得終端操作更加方便高效。