孫長印,毛亞寧,江 帆,王軍選
(1.西安郵電大學 通信與信息工程學院,陜西 西安 710121;2.西安郵電大學 信息通信網絡與安全重點實驗室,陜西 西安 710121)
蜂窩網絡流量爆發式增長的驅動需要有更多的頻譜支撐當代無線通信系統的發展。其中,毫米波(millimeter Wave,mmW)頻段因其具有高帶寬等優勢而備受關注。在第五代移動通信技術(5th Generation Mobile Communication Technology,5G)中使用mmW將緩解目前運行的4G蜂窩通信系統中的頻譜短缺問題[1],這使得mmW技術成為5G蜂窩通信系統的關鍵技術之一。
mmW頻段充足的頻譜資源可以為蜂窩網絡提供更大的容量。同時,mmW還具有受環境影響小、速率高、能量集中且方向性好等優點[2]。除此之外,mmW頻段的天線尺寸相比于Sub-6GHz 頻段的更小,為元器件在終端的高度集成化提供了便利,其配合大規模多入多出(Multiple Input Multiple Output,MIMO)技術部署規模更大的天線陣列,可提高系統的抗干擾能力和頻譜利用效率[3]。但是,mmW波長短和衍射能力差,易受物體遮擋,導致其較大的傳播損耗和較小的網絡覆蓋范圍。因此,mmW組網通常需要基于多頻段mmW異構網絡結構改善鏈路間歇傳輸及切換頻繁等突出問題,在該異構網絡框架下優化問題是資源管理的關鍵[4]。同時,為了改善mmW鏈路間的干擾及其頻繁的切換問題,資源分配如功率控制技術成為解決問題的主要手段。
傳統功率控制算法在mmW網絡中存在隨著mmW頻段所需天線數量的增多,其獲取信道參數的開銷增加及目標優化算法通常需要多次迭代更新。因此,需研究mmW頻段多用戶干擾信道的傳輸和速率最大化的功率控制問題。干擾管理已經成為改善系統性能受限問題的重要手段,相鄰終端產生的干擾具有非凸性,導致功率控制問題不存在最優解。因此,功率控制問題的研究重點就集中在探索次優及高性能的實現方式上。隨著研究的深入,提出了一些經典的功率控制算法被提出,如迭代注水算法[5]、加權最小均方誤差[6](Weighted Minimum Mean Square Error,WMMSE)算法、干擾定界算法[7]以及窮舉搜索算法[8]等。經典算法在mmW系統運算時可能會進行大量的復雜矩陣運算,加之用戶的信道信息獲得開銷大和位置實時變換等影響,導致傳統算法不能很有效地處理這些問題。
深度學習的興起為改善上述問題提供了一個可行的方向,在提供良好性能的同時可以大幅度減少計算時間。例如,基于傳統算法輸入與輸出之間非線性映射關系,文獻[9]利用深度神經網絡對WMMSE功率控制算法進行逼近,結果表明在使用時間少于傳統算法5%的情況下可以達到傳統算法約98%的性能。雖然該方法的復雜度較低,但其性能也受限于WMMSE算法的性能。文獻[10]利用無監督算法直接在訓練階段將傳輸和速率最大化作為優化目標,在一定程度上打破了傳統算法的性能瓶頸,但存在用戶數量和信道系數非廣義、理想信道估計等問題,對于實際通信場景和mmW頻段的性能表現未知。文獻[11]針對下行mmW大規模MIMO系統提出了一種基于強化學習的功率控制算法,基于快速爬坡算法得到基站對多終端最優的功率分配。但是,上述mmW網絡的功率分配算法都需要mmW頻段信道參數作為輸入,這一點與傳統算法類似,存在包括mmW系統由于數量眾多的天線信道估計開銷和頻繁切換產生的波束搜索開銷等問題。
近年來,有研究者發現mmW信號的到達角度、離開角度以及角度功率譜與Sub-6GHz信號具有一致性,并將此用于mmW和6 GHz以下的頻段組成的mmW異構網絡系統[12]。文獻[13]對利用低頻預測高頻信道參數進行了研究,通過把mmW信道信息獲得方式轉化為壓縮感知問題,再結合K-最鄰近思想與廣義近似消息傳遞(Generalize Approximate Message Passing,GAMP)算法對信道估計問題進行求解。文獻[14]證明了一定條件下存在映射函數,使得利用Sub-6GHz信道信息可以直接預測出最佳的mmW波束和阻塞狀況,并用深度神經網絡實現了這種映射關系。文獻[15]研究了神經網絡對Sub-6GHz信道信息和mmW最優功率分配之間非線性關系的擬合,但其采用的是WMMSE算法訓練,神經網絡的性能也會受到WMMSE算法可達到系統性能的限制,得到的功率控制不是全局最優的。以上文獻表明,利用Sub-6GHz信號輔助mmW進行功率控制具有可行性,相較于mmW頻段,Sub-6GHz 的信號測量質量高、信道數量少及開銷小。因此,利用Sub-6GHz 信道信息輔助mmW系統的無線資源管理值得研究。
針對現有研究中存在的性能受限、算法復雜度高及mmW信號測量開銷大和質量差等問題,擬提出一種利用無監督DNN和Sub-6GHz頻段跨頻預測mmW頻段的功率控制算法。該算法利用無監督深度學習,直接將最大化mmW傳輸和速率作為網絡損失函數,并且利用集成學習組合多個獨立訓練的神經網絡進一步提升算法性能。同時,利用神經網絡實現使用Sub-6GHz 頻段預測mmW頻段的最佳功率分配,從而改善mmW信號測量帶來信令開銷大和測量質量差的問題。通過將噪聲功率加入網絡的輸入特征提升模型對不同噪聲功率的適應性,增強模型的泛化性能。為了驗證所提算法的可行性,將其與加權最小均方誤差算法、最大功率控制算法、隨機功率控制算法和二進制窮舉搜索算法等4種算法的系統和速率進行對比。
假設用戶單天線干擾模型中共有K=4個基站和用戶,基站只與單個終端進行消息傳輸。每個基站都配備了Sub-6GHz頻段以及mmW頻段的均勻線性陣列天線(Uniform Linear Array, ULA),兩者的天線數量分別為Msub-6和MmmW。Sub-6GHz用于信道信息獲取及上行數據傳輸,而下行數據傳輸主要發生在mmW頻段[16]。多用戶通信模型如圖1所示。

圖1 多用戶通信模型

(1)

為減少mmW鏈路的信號損耗,基于碼本的波束賦形算法,假設fk∈MmmW×1和fj∈MmmW×1分別表示基站k和基站j下行波束形成向量,和分別表示用戶i到基站k和基站j的mmW頻段信道信息,則用戶i處收到的mmW信號的表達式為

(2)

(3)

由香農公式可得單位帶寬上用戶i的接收速率表達式為

(4)
(5)
式中,βi>0表示每個用戶的權重。此時,和速率最大化問題為
s.t. 0≤pk≤pmax
k=1,…,4
(6)
則最優的功率分配表達式為
(7)
此時,只要求得最優的功率分配p*,系統加權和速率就能取得最大值Rmax。
通過對利用Sub-6GHz輔助mmW進行功率分配的問題進行分析,證明在特定條件下存在從Sub-6GHz信道信息到mmW最佳功率分配的確定性映射關系。
假設用戶的位置信息為(x,y),則用戶和基站之間的信道信息[14]可以表示為

設χ={(x,y)}為用戶可以存在的所有地點信息的集合,若hsub-6∈Msub-6×1和hmmW∈MmmW×1分別表示用戶的Sub-6GHz頻段和mmW頻段的信道信息,則Hsub-6={hsub-6}和HmmW={hmmW}分別是所有用戶的Sub-6GHz和mmW信道信息的集合。此時,從用戶地點信息到兩種頻段等效增益的映射函數[8]可以分別定義為
(8)

(9)
此時可以求出用戶i的Sub-6 GHz信道增益到mmW信道增益的映射為
(10)
結合式(6)和式(10),可以將和速率最大化問題轉化為
s.t. 0≤pk≤pmax
k=1,…,4
(11)
結合式(7)和式(11),可得mmW系統最優功率分配表達式為
(12)
利用一個全連接的深度神經網絡解決式(11)的功率控制問題。網絡由包含K2個節點的輸入層、K個節點的輸出層和L-1個全連接的隱藏層組成,層的索引從0到l,具體的網絡結構如圖2所示。

圖2 神經網絡示意圖

若第k層是隱藏層,則網絡當前層的輸出向量為
ck=ReLU(BN(Wkck-1+bk))
(13)
式中:ck的長度為lk;ck-1表示網絡前一層的輸出向量,其長度為lk-1;Wk表示第k-1層和第k層之間的權重矩陣;bk是長度為lk的偏置向量;BN(·)表示批量歸一化函數;ReLU(·)表示線性整流函數max(x,0)。為了初始化模型的輸入層,定義l0=K2,c0=hsub-6。
輸出層決定了所有基站的發射功率,其計算表達式為
(14)
式中:WL表示第L-1層和第L層之間的權重矩陣;bL是長度為lL的偏置向量。需要注意的是,由于發射功率必須在[0,max]之間,因此輸出層使用Sigmoid函數作為激活函數。那么,就可以得到基站i向用戶i的發射功率的表達式為
(15)
式中,cL,i表示第L層輸出的第i個元素。
文獻[9]和文獻[11]是利用WMMSE算法產生的功率控制結果訓練神經網絡,其損失函數定義為網絡輸出和WMMSE算法之間的差距。該算法具有較低的在線計算復雜度,但利用該算法訓練的網絡其性能不會優于WMMSE算法。因此,在訓練網絡時需要對傳統算法做出改變。首先,舍棄傳統的有監督算法,采用無監督學習,直接最大化和速率。其次,訓練過程中計算傳輸和速率時,直接利用mmW頻段的信道增益,即利用神經網絡逼近Sub-6GHz頻段信道增益與mmW頻段最優功率分配之間的映射關系。具體而言,將式(11)中的目標函數作為訓練網絡的損失函數,表達式為
(16)


(17)
式中:m為小批量樣本的數量;t是迭代次數。通過式(17)可以得到損失函數對θ的導數gt,然后對θ更新迭代,更新表達式為
(18)
式中:ε為學習率;ot+1和qt+1為一階和二階矩估計;μ和υ分別為一階矩估計和二階矩估計的衰減速率;τ表示防止梯度為Nan的數值穩定常數。具體來說,使用Adma優化器對參數θ進行更新迭代最小化損失函數,計算步驟如下。
步驟1初始化參數。ε=0.001,μ=0.9,υ=0.999,σ=10-8,Xavier初始權重參數集θ,m0=0,n0=0,迭代次數t=0。
步驟2計算包含m個樣本的小批量導數gt。
步驟3更新一階矩估計和二階矩估計,表達式分別為
步驟4根據式(18)更新權重參數集,θt→θt+1。
神經網絡訓練時的具體參數如表1所示。

表1 神經網絡參數
在神經網絡的訓練過程中發現,即使采用充分的訓練數據和利用式(16)中新定義的損失函數,也不能保證對每個Sub-6 GHz信道增益都能輸出最優的功率分配p*,因此梯度下降法有可能導致網絡陷入局部最優。為此引入集成學習的思想進一步提高功率控制的性能,使其可以靠近全局最優,集成學習通過組合多個弱學習器獲取最優的性能。對于功率控制問題,提出建立一個集成深度神經網絡,該網絡由M個單獨訓練的網絡組成,假設所有單獨訓練的網絡都具有相同的結構,簡化集成網絡的實際部署。一個集成深度網絡由M組不同初始參數和獨立生成的數據進行訓練,最終可以增強學習器的分集增益[17]。
為了通過集成學習提升模型性能,將網絡的輸入hsub-6分別送到M個訓練完成的網絡中,第m個網絡定義為Net-m,其輸出的功率控制結果為pm,選擇器收集所有網絡的輸出以及和hsub-6對應的mmW頻段信道增益hmmW。然后計算每個網絡輸出功率對應的mmW頻段用戶傳輸和速率,選擇最高的和速率對應的功率控制結果作為集成網絡的輸出。具體的集成神經網絡結構如圖3所示。

圖3 集成神經網絡結構
使用集成功率控制網絡需要注意的是用MSGD訓練神經網絡經常會陷入局部最優,因此組合多個弱DNN可以顯著提升和速率性能。深度網絡只需少量矩陣乘法,計算復雜度較低,而集成神經網絡是以線性方式增加復雜度的,因此其復雜度不會顯著增加。通過訓練多個不同參數和訓練集的神經網絡提升分集增益,這種方法也可以用于其他一些符合條件的功率控制方法。

由于實際信道信息的生成存在困難,因此依照一般工程中的常規做法,即通過射線追蹤獲取信道信息。樣本數據由3D射線追蹤軟件構建的Deep MIMO數據集產生[18],該數據集里的雙頻段通信場景O1包括頻率在3.5 GHz的Sub-6 GHz基站數據集O1_3p5和28 GHz的mmW基站數據集O1_28。此外,考慮到在線訓練所需的巨大開銷,采取非在線方式對網絡進行訓練。

為驗證所提算法的合理性和有效性,設定了兩種通信場景。
場景1主街道。場景1模擬了大量用戶在馬路上散步時的情況,馬路兩邊設立對稱分布的4個基站,每個用戶均勻散布在基站覆蓋的范圍,每個基站隨機選擇一個用戶進行通信,選中每個用戶的概率相同。
場景2十字路口。場景2選擇的是兩條街道的交叉地段,以模擬用戶通過路口的情形。4個基站散布在十字路口的4個角落,所有的用戶均勻分布在基站的覆蓋范圍,數據生成方式同場景1,具體參數設置如表2所示。

表2 仿真參數
通過分析模型輸入為Sub-6 GHz和mmW時的用戶和速率,從而驗證Sub-6 GHz信道參數預測mmW功率控制的可行性。具體來說,場景1和場景2都通過單天線傳輸信息,訓練方式是將4個用戶的Sub-6 GHz和mmW信道增益當作模型的輸入,將mmW頻段的功率分配結果當作模型的輸出,即Sub6-mmW表示利用Sub-6 GHz預測mmW,mmW-mmW表示利用mmW預測自身功率分配。
Sub6-mmW和mmW-mmW在場景1和場景2下的和速率分布情況具體如圖4所示。由圖4可以看出,在場景1下,Sub6-mmW與mmW-mmW所得到的和速率分布情況大致相同。在場景2下,Sub6-mmW有大約10%的樣本和速率略低于mmW-mmW,且位于30%以下的部分??紤]到該部分對應于邊緣用戶,說明可能由于場景2下用戶分布比較集中于十字路口,邊緣用戶較多,容易受到相鄰基站干擾。此外,場景1和場景2下Sub6-mmW的總和速率分別達到了mmW-mmW的98.35%和96.91%。

圖4 場景1和場景2下和速率分布
通過以上分析,盡管在某些局部Sub6-mmW的性能略差于mmW-mmW,但兩者性能還是非常相近。因此,使用Sub-6 GHz信道增益輔助mmW功率控制是可行的。
在場景1和場景2下,假設基站和移動端都使用單天線進行收發,且使用建立好的集成神經網絡模型對兩個場景分別訓練,并將WMMSE算法、最大功率控制算法、隨機功率控制算法和二進制窮舉搜索算法作為對比算法。二進制窮舉搜索算法是在發射功率區間[0,pmax]上搜索,使得所有用戶傳輸和速率最大的功率分配。為降低計算復雜度,采用二進制對其約束,即基站發射功率只能選0或者pmax,理論上最壞情況下需要搜索2K-1次才能獲取最優功率分配,為保證搜索次數較少時的性能,每次搜索從所有分配中隨機選取。由于WMMSE算法需要多次的迭代才能達到較好的性能,因此在場景1下設置WMMSE算法迭代次數最大值為30。為了方便與所提算法進行比較,二進制窮舉搜索算法的最大搜索次數和集成神經網絡的規模最大也設置為30,而場景2設置為20。隨機功率控制由于每次的分配都是隨機生成的,因此其性能存在一個小范圍的變換。對其進行多次初始化后取其用戶傳輸和速率最大值作為對比輸出,隨機功率控制算法和最大功率控制算法不隨迭代次數變換。
將所提算法與WMMSE算法、最大功率控制算法、隨機功率控制算法及二進制窮舉搜索算法進行對比,在場景1和場景2下不同功率控制方式總和速率的對比情況如圖5所示。

圖5 場景1和場景2下不同算法總和速率對比
由圖5可以看出,在兩種場景情形下,隨著迭代次數的增加,所提算法、WMMSE算法和二進制窮舉搜索算法的平均系統和速率都在增加,而所提算法明顯優于另外4種算法。場景1相對于場景2用戶較多分布于小區中心區域,信噪比較高,整體和速率較大。具體而言,場景1中集成/迭代次數分別是10、20和30時,所提算法的和速率是WMMSE算法的1.236、1.125和1.134倍。此外,當迭代次數小于12時,二進制窮舉搜索算法平均和速率相比于所提算法表現較差,可能是由于有一部分樣本還沒搜索到最優功率分配。當迭代次數大于15時,二進制窮舉搜索算法和速率性能接近所提算法,此時幾乎所有樣本都搜索到最優的功率分配。場景2在集成/迭代次數分別是5、10和15時,所提算法的和速率是WMMSE算法的1.212、1.106和1.105倍,是二進制窮舉搜索算法的1.34、1.12和1.05倍。當WMMSE算法的迭代次數較大以及用戶數量較多時,會帶來更大的線性復雜度。如果計算資源受限,只運行少量的迭代,那么所提算法的性能增益就會更加明顯。
通過所提算法、WMMSE算法、最大功率控制算法、隨機功率控制算法及二進制窮舉搜索算法計算出所有樣本的用戶和速率,在場景1和場景2下不同算法和速率分布情況具體如圖6所示。

圖6 場景1和場景2下不同算法和速率分布
由圖6可以看出,在場景1中:通過最大功率控制算法求出的測試樣本系統和速率主要分布在[0,15]區間,超過98%的樣本系統和速率低于15 bit·s-1,隨機功率控制算法有75%的樣本和速率低于15 bit·s-1;WMMSE算法計算出的樣本和速率主要分布在[4,23]區間,有大約20%的樣本分布在和速率小于12.5 bit·s-1,而所提算法主要分布在[17,24]區間,和速率小于17 bit·s-1的概率為0;二進制窮舉搜索算法樣本分布接近所提算法,和速率大于20 bit·s-1的樣本約占75%,而所提算法約為87%。在場景2中:隨機功率控制算法和最大功率控制算法對所有樣本計算的和速率主要分布在[8,12]區間;WMMSE算法分布在[0,17]區間,有大約15%的樣本和速率小于5 bit·s-1;二進制窮舉搜索算法有約12%的樣本和速率分布在[0,14]區間,而所提算法的樣本和速率主要分布在[14,17]區間。CDF分析表明,在兩種場景下所提算法性能在整個性能區間表現優于其他4種算法。
為了量化比較,表3列舉了不同功率控制算法對于所有測試樣本的平均和速率。

表3 不同算法平均和速率比較
從表3可以看出,在兩個場景下,所提算法所有樣本和速率分別是WMMSE算法的1.133倍和1.105倍,這些結果驗證了使用無監督算法預測mmW功率控制具有的良好的性能。
為驗證網絡輸入層加入噪聲功率之后的和速率性能,在所提算法的基礎上設計了一種輸入維度包含噪聲功率的改進模型。具體來說,在場景1中將噪聲功率分別設置為[-70,-75,…,-125](dBm·MHz-1),然后計算出對應噪聲功率下所有測試樣本的平均和速率,即由原始網絡計算的和速率。同時,為增強網絡泛化能力,數據集3生成方式是對每個樣本加入噪聲功率,噪聲功率從區間[-70,-75,…,-125]中隨機取。每次迭代使用不同的隨機種子,此時網絡的輸入由原來的K2變成K2+1,然后對網絡進行訓練,使其具備處理一定范圍噪聲的能力。不同噪聲功率下原始網絡和輸入層加入噪聲功率對網絡的和速率性能的影響如圖7所示。

圖7 輸入層加入噪聲功率對和速率影響
由圖7可以看出,當噪聲功率為-95 dBm·MHz-1時,輸入噪聲的網絡性能對原始網絡性能的占比約為93.33%,而噪聲功率為-125 dBm·MHz-1時占比已經達到了99.19%。這表明在噪聲功率較小的情況下,DNN網絡輸入維度加入噪聲之后性能網絡損失很小,此時的模型具有較高的泛化能力,對不同功率的噪聲具有較好的適應性。
利用深度學習技術改善了Sub-6GHz預測mmW功率控制的問題,實現了mmW系統中高效實時的功率控制。首先,利用無監督神經網絡,直接將最大化用戶mmW頻段和速率作為損失函數,實現了從Sub-6GHz到mmW頻段最優功率分配的函數映射,即輸入Sub-6GHz信道信息即可預測mmW最優功率分配。同時,還實現了多個網絡的集成。接著,通過將噪聲功率加入神經網絡的輸入層,從而提升網絡的泛化能力。最后,利用Deep MIMO數據集對模型進行了測試與評估。仿真結果表明,所提算法對mmW頻段功率分配具有較好的預測能力和泛化能力。但是,所提算法只研究了傳輸功率在固定區間的情況,未來的工作將致力于研究mmW通信加入發射功率約束時的功率控制。