丁 丹,楊 柳,劉步花
(航天工程大學 電子與光學工程系,北京 101416)
測控數據傳輸包括飛行器的遙控、遙測和載荷數據傳輸[1-2]。文獻[3-5]從降低解調門限的角度,分別提出了相位噪聲迭代補償、傳輸通道優化設計和多碼率融合LDPC碼等提升傳輸速率的方法。文獻[6-8]則從優化傳輸策略的角度,分別提出了SOQPSK、空時編碼、變速率與空間復用相結合等提高傳輸效率的方法。然而,上述方法是根據試驗任務預設指標進行逐模塊設計,并針對試驗場區常規信道環境進行各模塊的局部優化,包括調制解調、信道編解碼和信道均衡等。然而,作戰條件下的測控信道呈現非線性、多徑、干擾和時變等復雜特性,難以用常規線性數學模型描述,各模塊獨立優化的傳統方式不能做到全局最優擬合與跟蹤,嚴重影響戰時系統整體性能的發揮。
深度學習[9-10]是人工智能領域的創新成果,能夠利用神經元的靈活組合來逼近任意復雜的系統函數,并通過在線學習適應環境的時變性,從而將系統調節為整體性能最優的架構。深度學習網絡是克服系統復雜性、適應環境時變性的有力工具,是解決上述問題的有效手段。文獻[11-13]的研究成果說明,深度學習可以從信道編解碼、信道估計、信道均衡、信號檢測和端到端接收等多個方面提升物理層傳輸性能。
本文研究基于深度學習的測控數據傳輸技術,運用深度學習網絡統一實現調制解調、信道編解碼、信道均衡、非線性補償和干擾消除等多項功能,從而將系統性能始終調節在全局最優狀態,解決航天測控系統對戰場復雜時變信道適應能力的短板弱項。
深度神經網絡(Deep Neuron Network,DNN)是通過多層感知器的級聯形成,因而又稱為多層感知器,這就構成了多隱層的前饋神經網絡,結構如圖1所示。

圖1 感知器模型和DNN結構Fig.1 Perceptron model and DNN structure
該DNN總計有L+1層,其中第0層為輸入層,第1~L-1層為隱藏層,第L層為輸出層,相鄰層之間通過前饋權值矩陣連接。假設第l層有nl個神經元,這些神經元的輸入組成的向量為z(l),輸出組成的向量為h(l)。同時,令u=h(L)對DNN最終的輸出與隱藏層的輸出進行區分,給定一個訓練樣本的特征x,此時有h(0)=z(0)=x。根據DNN的計算規則有:
z(l)=W(l)z(l-1)+b(l),l=1,2,...,L,
式中,W(l)∈nlnl-1為第l~l-1層的權值矩陣;b(l)∈nl為第l層的偏置向量。則有:
h(l)=fl(z(l)),
式中,fl(·)為第l層的激活函數。DNN常用的隱含層激活函數有S形(sigmoid)函數、雙曲正切(tanh)函數和整流線性單元(reLu)函數等,形式如下:
輸出層的激活函數視DNN所要解決問題的性質而定,回歸問題通常采用線性激活函數或者sigmoid函數,二分類問題通常采用sigmoid函數,多分類問題目前采用softmax函數,其形式如下:
綜合上述過程,訓練樣本的特征x首先被送到輸入層,然后沿圖中的箭頭方向依次傳播過各個隱藏層最后到達輸出層,得到最終的網絡輸出,這一過程被稱為前向傳播。
基于深度學習的測控數據傳輸系統設計如圖2所示。核心思想是利用DNN代替解調、解碼和均衡等模塊實現測控數據端到端接收,將各模塊的局部優化轉變為系統的全局優化,實現對復雜時變信道響應的最優逼近,獲得整體最優性能。

圖2 基于深度學習的測控數據傳輸系統設計Fig.2 Design of TT&C data transmission system based on deep learning
基于深度學習的測控數據傳輸系統工作模式包括以下幾種:
(1)運用深度學習的測控數據變速率傳輸模式
利用深度學習網絡逼近復雜的信道函數,并且準確感知鏈路余量的細微變化,通過信道狀態指示反饋,及時、精細地調整編碼速率、調制階數,從而最大程度地利用鏈路余量實現最優的變速率傳輸。傳輸效率明顯高于傳統恒定速率傳輸模式,如圖3和圖4所示。

圖3 傳統恒定速率傳輸模式Fig.3 Traditional constant rate transmission mode

圖4 基于深度學習的測控數據變速率傳輸模式Fig.4 Variable rate transmission mode based on deep learning
信道狀態指示用來表征當前鏈路余量所處的檔位,而非具體鏈路余量值。若劃分16檔位,則信道狀態指示只需4 bit數據量,較容易實現實時反饋傳輸。
(2)基于深度學習的測控數據抗干擾傳輸模式
利用深度學習網絡對復雜信道的最優逼近獲得更多的鏈路余量,在恒定速率條件下獲得更強的抗干擾能力。
(3)基于深度學習的測控環境自主認知模式
利用平時衛星過境空閑圈次,對各種典型信道環境進行大量離線訓練;戰時任務圈次通過在線學習識別并適應信道環境。


圖5 基于深度學習的測控數據傳輸工作示意Fig.5 Schematic diagram of TT&C data transmission based on deep learning
在離線訓練過程中,訓練數據由2部分組成,一是神經網絡的期望輸出,即發送數據si′∈nL;二是由發送數據經過發送端處理后經信道傳輸到達接收端的接收數據yi′∈n0。設訓練樣本的數量為ζ,則DNN網絡的訓練樣本集標簽可以表示為Υ={si′∈nL|i=1,2,...,ζ},訓練樣本集的特征可以表示為Ξ={yi′∈n0|i=1,2,...,ζ}。DNN網絡的待估參數為權值矩陣和偏置向量的集合θ={W(l),b(l)|l=1,2,...,L},DNN訓練集上的損失函數可以表示為:

在訓練數據的驅動下,采用誤差后向傳播方法以及Momentum,Root Mean Square,Adaptive Moment Estimation等優化算法[9]對上述損失函數進行迭代尋優,獲得對復雜非線性測控信道函數的最優逆濾波,再通過在線部署即可實現最佳信道估計和信號檢測。
仿真內容:非線性、多徑信道條件下,基于深度學習的測控數據傳輸性能及開銷。仿真條件如表1所示。
表1 仿真條件Tab.1 Simulation condition

參數類別參數取值深度學習網絡規模3層,分別含128,100,128個神經元傳統方法LS均衡、功率回退[14-15]多徑信道模型ITU車行信道模型非線性模型Saleh模型
傳輸性能仿真結果如圖6所示。在“多徑+非線性”這樣一種較為復雜的信道條件下,相比傳統的“LS均衡+功率回退”方法,運用深度學習網絡取代非線性補償、多徑估計與均衡和數據解調等模塊,性能仍然優于LS均衡、功率回退3 dB的傳統方法,說明本文方法能夠在保證更優傳輸性能的前提下,進一步提高3 dB發射功率,而不受非線性信道的影響;即本文方法可在獲得3 dB鏈路余量增益的前提下,仍然保持更優的誤碼率性能。還可把3 dB的鏈路余量轉化為數據速率的提升,可在保持相同鏈路余量的前提下,將數據速率提升為傳統方法的2倍,且誤碼率性能更優。

圖6 基于深度學習的測控數據傳輸性能Fig.6 Performance of TT&C data transmission based on deep learning
傳輸開銷仿真結果如圖7所示。在相同的誤碼率性能前提下,傳統測控數據接收機使用了128個導頻,而基于DNN的測控數據端到端接收機只需使用16個導頻,顯著降低了傳輸開銷。

圖7 基于深度學習的測控數據傳輸開銷Fig.7 Overhead of TT&C data transmission based on deep learning
系統復雜度估算:該3層深度學習網絡需要356次實數乘法,而傳統非線性補償、多徑估計與均衡、數據解調等模塊總共約需288次實數乘法、64次實數除法??梢娀谏疃葘W習的測控數據傳輸復雜度與傳統傳輸體制相當。
運用深度學習網絡代替傳統調制解調、信道編解碼和信道均衡等多個分立模塊,能夠將系統性能始終調節在全局最優狀態,從而在戰時復雜信道條件下,將傳輸容量提升至傳統體制2倍以上,或將鏈路余量提高3 dB以上,同時保持與傳統測控數據傳輸體制相當的系統復雜度。較低的網絡復雜度,再加上高速處理芯片的運用,可保證系統運行的實時性。深度學習網絡能夠以較小的代價有效提升航天測控系統對復雜戰場環境的適應能力,是一種十分具有潛力的新型傳輸技術,相關研究工作也可為各領域吸收人工智能創新成果提供有益借鑒。