霍浩淼,許威,2**,陳棟
(1.東南大學信息科學與工程學院,江蘇 南京 210096;2.紫金山實驗室,江蘇 南京 211111;3.小米科技有限責任公司,北京 100085)
大規模毫米波多輸入多輸出(MIMO,Multi-Input Multi-Output)相較于傳統的MIMO 技術的收發天線數較大,這帶來了性能優勢的同時信號檢測的復雜度也隨之增大。傳統的檢測方案中,性能最優的最大似然(ML,Maximum Likelihood)信號檢測方法計算復雜度極高,隨著傳送天線數以及調制維度的增加,該算法的復雜度呈指數增加。復雜度低的一些線性檢測算法如最小均方誤差(MMSE,Minimum Mean Squared Error)檢測算法,受復雜信道環境、信道估計誤差及大量非線性因素影響,性能往往比ML 差3 dB 以上[1]。
深度學習(DL,Deep Learning)利用深度神經網絡(DNN,Deep Neural Networks)已經成功地應用于通信中的各種場景[2]。深度學習以其獨特的訓練原理,不需要了解具體的工作機制,只需要合適的網絡和足夠的訓練數據就能解決問題,在處理非線性問題上已經顯示出巨大的潛力。文獻[3] 提出了一種被采用較多的檢測網絡(DetNet,Detection Network),它的結構可以看作是一個展開的遞歸神經網絡,性能優于一般的線性檢測算法,但DetNet 網絡設計中的輔助輸入輸出結構增加了檢測的復雜度。
智能反射面(IRS,Intelligent Reflecting Surface)是一種面向后5G 的新型通信方法[4]。它是由大量可重構無源元件組成的平面陣列,通過智能控制器,每個元件都能夠獨立地在入射信號上產生一定大小的相移,改變反射信號的傳播。IRS 通過將來自發射端的信號反射到接收端來協助通信,因為引入了智能反射面,IRS 輔助通信的檢測問題參數維度更大,復雜度也更高。
考慮到IRS 輔助通信系統中應用DL 進行信號檢測的潛力,本文根據IRS 信道特點和梯度下降更新思想,設計了一種應用于IRS 輔助通信的低復雜度深度檢測網絡,并給出了智能反射面輔助通信深度檢測網絡的仿真結果,最后對復雜度和誤碼率性能進行了對比。
圖1 為基站和終端借助智能反射面進行輔助通信的系統,IRS 通過將來自基站S的信號反射到終端D協助通信。其中,基站S天線數為M,終端D天線數為N,IRS 由K個被動的反射元件組成,這些元件可以使用面向通信的軟件進行控制并重新配置。

圖1 IRS輔助MIMO通信系統模型
終端接收到的信號為:

ML 檢測算法是性能最優的信號檢測算法,其判決準則為選擇使得信道轉移概率最大的向量?x 作為發射符號向量的估計值,即令,在所有可能的發射集合中找出滿足的發送集合。其中,Ω 表示所有發射符號向量的集合。
MIMO 信道的信道轉移概率是一個多維高斯分布,求得最大似然檢測的解為:

采用深度學習解決信號檢測問題,可以描述為設計恰當的檢測網絡結構,訓練適合的網絡參數,使得檢測網絡的輸出與實際傳輸信號的損失函數最小,以代替ML等傳統檢測器的作用。因此,智能反射面輔助通信檢測問題就轉化為了求解下述優化問題:

其中,W表示網絡權重,b表示網絡偏置,表示檢測網絡輸出的發射信號,L表示網絡損失函數。
在IRS-MIMO 檢測問題中采用梯度下降算法更新x的近似值為:

將式(4)展開,得到:

對于一次梯度下降迭代更新過程,信道矩陣通過信道估計得到,式子右邊的部分均為已知量,根據梯度下降更新算法的思想進行檢測網絡的結構設計。
根據式(5),本文提出了一種智能反射面輔助通信深度學習檢測網絡,將式中的已知量作為網絡設計的參數,根據展開式設計網絡的輸入輸出形式。網絡結構如圖2 所示,由L個結構相似的單元級聯組成,每個檢測網絡單元的輸入為(H2φH1+H0)Ty、(H2φH1+H0)T(H2φH1+H0)和,輸出為,其中每個單元的輸出作為下一個單元的輸入,也可以作為整個網絡的輸出。隨著網絡單元數的增加,檢測網絡的輸出更接近于發送信號。

圖2 智能反射面輔助通信深度檢測網絡結構
每個單元由三層全連接層和一個短路直連結構組成:第一層為3M*1 的輸入層,對應式(5) 中的輸入參數,M表示基站發射天線數,串聯連接所有輸入向量,并轉換成一維向量,然后輸出通過一個具有大量節點的全連接網絡,采用sigmod 函數作為激活函數,輸出和一個關于的短路直連一起作為下一層的輸入。通過引入短路直連結構,可以強化部分輸入的作用,充分挖掘復雜信道的非線性關系。第二層為4M*1 的隱藏層,采用tanh 函數作為激活函數。第三層為M*1 的輸出層,每個單元的輸出均可以作為下一個單元的輸入或整個網絡的輸出。
每個網絡單元在檢測網絡中具有不同的重要性,研究證明靠前的網絡單元在網絡中的作用大于靠后的單元,因此本文在檢測網絡中引入權重縮放向量系數,將單調的非遞增系數應用于單元權重系數,按照重要性遞減方式選擇單元權重,忽略不重要的網絡單元,降低了訓練檢測器的計算復雜度。網絡選取的權重縮放向量系數為半指數函數:

其中,L表示網絡的單元數。
為了降低網絡訓練過程的復雜度,設計了不包含矩陣求逆過程的網絡損失函數為:

根據設計的智能反射面輔助通信深度檢測網絡,本文提出的智能反射面輔助通信深度學習信號檢測算法如下:
輸入:y、H0、H1、H2、φ
參數:W、b、β
步驟:
(1)根據信道估計獲得矩陣數據,組合y、H0、H1、H2和φ,獲得輸入向量;
(2)訓練數據輸入檢測網絡,計算損失函數;
(3)采用Adam 優化算法和端到端學習方式,優化深度檢測網絡的參數,使得損失函數最小;
(4)重復步驟(2)、(3)直到收斂;
為了驗證提出的檢測網絡的有效性,本節仿真了智能反射面輔助通信系統深度學習檢測網絡的誤碼率性能曲線,并與經典檢測算法的性能進行比較。仿真的系統模型調制方式為QPSK,基站天線數M為8,終端天線數N為2,深度檢測網絡單元數為90,系統樣本數為10 000,其中80%用于訓練集、10%用于測試集、10%用于驗證集,網絡采用變化的學習率,初始學習率為0.001,衰變因子和衰變步長分別為0.97、1 000。
圖3、圖4 和圖5 展示了具有不同大小的IRS 陣列的通信系統在7~15 dB 信噪比(SNR,Signal-to-Noise Ratios)下的誤碼率性能曲線。
圖3 展示了IRS 單元數K=16 時的誤碼率性能曲線。可以看出,智能反射面輔助通信深度學習檢測網絡具有遠優于MMSE 等線性檢測算法的誤碼率性能。在SNR 為11 dB 時,智能反射面輔助通信深度學習檢測網絡相較于MMSE 檢測方法有接近2 dB 的性能增益,與ML 最優檢測算法的差距在0.8 dB 左右。

圖3 K=16時各檢測算法誤碼率曲線
圖4 展示了IRS 單元數K=36 時的誤碼率性能曲線。可以看出,智能反射面輔助通信深度學習檢測網絡仍然具有優越的誤碼率性能。在SNR 為11 dB 時,智能反射面輔助通信深度學習檢測網絡相較于MMSE 檢測方法有接近2.2 dB 的性能增益,與ML 最優檢測算法的差距在0.6 dB 左右。

圖4 K=36時各檢測算法誤碼率曲線
圖5 展示了IRS 單元數K=64 時的誤碼率性能曲線。可以看出,在配備更大IRS 陣列的通信系統中,智能反射面輔助通信深度學習檢測網絡仍然具有優越的誤碼率性能。在SNR 為11 dB 時,智能反射面輔助通信深度學習檢測網絡相較于MMSE 檢測方法有接近2.2 dB 的性能增益。

圖5 K=64時各檢測算法誤碼率曲線
表1 對比了深度學習檢測網絡與一些經典檢測方法的計算復雜度,其中Q表示調制階數。智能反射面輔助通信深度學習檢測網絡的計算量可以用浮點運算數表示,計算為(2×3M-1)×M×L=6M2L-ML,因此深度學習檢測網絡的復雜度量級為O(M2L)。從表1 中可以看出,智能反射面輔助通信深度學習檢測網絡具有和線性檢測算法同一量級的復雜度,遠低于ML 最優檢測算法的復雜度。

表1 各檢測算法復雜度對比
本文根據檢測問題中梯度下降更新算法的展開式,設計了一種低復雜度的面向智能反射面輔助通信的深度學習檢測網絡。該網絡采用多個具有相似結構的單元級聯,在單元中引入短路直連結構加強部分輸入的影響,并通過單元權重系數對不同單元的重要性進行調節。仿真結果表明,智能反射面輔助通信深度學習檢測網絡具有和線性檢測算法相當的計算復雜度,遠低于最大似然檢測,并且具有優于MMSE 等線性檢測算法的誤碼率性能。在未來的工作中,可考慮將此檢測網絡推廣到更大規模智能反射陣列和高階調制方案上。