潘長鵬 汲萬峰 韓玉龍
(海軍航空大學 煙臺 264001)
隨著信息時代的不斷發(fā)展,人們需求的各種無線通信業(yè)務日益增加,支持各種無線業(yè)務的通信系統層出不窮、日新月異,無線頻譜成為越來越緊缺的資源。雖然已存在的各種通信系統都在使用新技術提高其自身的頻譜利用率,但有限的頻譜資源也越來越不能滿足日益增長的用戶需求。從時域和空域的角度觀察發(fā)現,靜態(tài)授權分配的頻段存在許多未被充分利用的“頻譜空洞”,也就是頻譜的利用率非常低,這與頻譜資源日益短缺的問題互相矛盾[1]。因此認知無線電技術(CR)應運而生。
CR技術可以實現認知用戶,也即次級用戶在空閑頻段上進行通信,空閑頻段主要包括非授權頻段和授權頻段。在授權頻段上進行通信就要求次級用戶要具有認知能力,可以對其周圍無線環(huán)境的歷史和當前狀況進行檢測、分析、學習、推理和規(guī)劃,以使用授權用戶的空閑頻譜信道資源進行通信,從而提高頻譜的使用效率例。CR技術的出現,為解決頻譜資源短缺,實現頻譜動態(tài)管理以及提高頻譜利用率開創(chuàng)了嶄新的局面。
假定次用戶有完美的頻譜感知能力,次用戶采用正交式頻譜接入進行通信,次用戶對頻譜空洞的使用不會對主用戶造成任何干擾。次用戶感知到可用頻譜后,要解決的主要問題就是各用戶如何高效地使用空閑頻譜。這時,可用的帶寬也隨之確定,次用戶可以控制的資源就只有調制方式和發(fā)射功率。我們將不考慮用戶所采用的具體信號調制方式,理想地認為用戶采用了最適合信道傳輸的某種調制方式。在這樣的條件下,次用戶可控制的資源就只有發(fā)射功率了[2]。因此,該信息系統可以看作是功率維約束下的柔性系統構建問題,也是一個動態(tài)頻譜管理問題。該問題可以描述為在已經準確感知到可用空閑頻譜后,各次用戶在頻譜上合理分配功率,以實現頻譜的高效使用。
假設有K個次用戶,感知到N個空閑頻段可以使用,在頻譜管理算法執(zhí)行過程中可用空閑頻譜不發(fā)生變化,i表示次用戶,n表示頻段。第i個次用戶在第n個頻段功率分配情況表示,表示用戶i的最大發(fā)射功率。顯然,用戶i分配的總功率不能超過其最大發(fā)射功率,即:

用戶i的收益不僅與自己功率分配情況有關,還要受到其他用戶的影響,因此用戶i的效用(收益)函數可寫為

對于一個網絡而言,衡量其性能的指標是各個用戶效用的函數,因此該模型可寫為如下形式的優(yōu)化問題:

用戶的效用函數可以根據實際應用背景的要求而變化,并不唯一。但是對于一個通信用戶而言,他最關心的其服務質量,而其服務質量的一個重要的指標就是數據傳輸速率[3]。用戶的傳輸速率不僅與自身的功率有關,還與其他用戶的干擾有關,從信息論角度看,這是個干擾信道問題。眾所周知,干擾信道的容量域目前還不知道,因此不能準確地寫出用戶速率的表達式。可做如下合理簡化:假定用戶發(fā)射的是復高斯信號,接收端的噪聲為高斯噪聲,不使用干擾消除技術,接收端僅把干擾作為高斯噪聲處理。這樣,用戶i的效用函數可用下式表達:

對于系統效用函數,有下面四種選擇。
實際選用哪個作為系統性能指標則根據需要而定。
在上面建立了頻譜管理的優(yōu)化模型。但是,在上面任意的系統目標函數下,該問題幾乎都是個NP-hard的問題,在當前理論下多項式時間內找到其最優(yōu)解是不可能的。下面我們采用博弈論方法來求解此問題[4]。
之所以采用博弈論的方法,是出于以下幾方面的原因。第一,動態(tài)頻譜管理問題是一個次用戶之間爭奪頻譜資源的問題,一個次用戶的行為會對其他次用戶的收益造成影響。而博弈論正是研究沖突的數學,所以該問題與博弈論研究的內容性質比較吻合,可以放到博弈論的框架下分析。第二,博弈論提供了多種不同的最優(yōu)性準則,即均衡點。不同的應用場景下,可以采用不同的均衡定義或者博弈類型對問題進行分析,而不是僅限于最優(yōu)化問題,博弈所帶來的這種方便性是優(yōu)化所不具備的。第三,應用非合作博弈理論可以有效地尋找解決動態(tài)頻譜管理問題的非中心式方法,特別是在無法建立中心控制機制的時候,這種非中心式的方法就更加重要。而且從目前來看,無線通信越來越向著分布式的方向發(fā)展,在這個背景下,探討動態(tài)頻譜管理的非中心式方法也有其重大意義[5]。
優(yōu)化問題是從系統的角度來看問題,因此目標函數是對整個系統總體性能的一個描述。博弈與優(yōu)化的一個區(qū)別在于,博弈是從每個局中人的角度來看待問題。對于非合作博弈而言,局中人關心的只是自己的利益,而不關心對其他局中人的影響[6]。每個局中人追求的是自身利益的最大化。因此,對于動態(tài)頻譜管理問題,其非合作博弈模型可以用策略式描述如下:
1)局中人:次用戶,i=1,2,…,K

與優(yōu)化模型相比,博弈模型中并沒有考慮系統的效用函數,這在一定程度上簡化了計算復雜度,同時也不能保證系統效用函數有很好的性能。此外,非合作博弈中,用戶間不協作,沒有或者有非常少的信息交流,這就為動態(tài)頻譜管理的非中心式實現提供了可能性[7]。
對非合作博弈問題最重要的是找到其納什均衡點,因此均衡點的存在性是個很重要的問題。動態(tài)頻譜管理博弈是個策略空間連續(xù)的博弈問題,其效用函數是連續(xù)的,納什的存在性定理并不能直接適用于該問題,但這類博弈的混合策略納什均衡點仍然一定存在。而在混合策略均衡點,發(fā)送端的功率并不確定,而是以一定的概率采用一定功率發(fā)送,這無疑會增加系統的復雜性,實現起來并不簡單。因此,我們更關心的是純策略納什均衡點。
定理:令G表示策略式非合作博弈。如果對任意局中人i,其策略空間Si是個非空緊凸集,效用函數ui()
s是s的連續(xù)函數,是si的擬凹函數,則博弈G至少有一個純策略納什均衡點。
考慮動態(tài)頻譜管理博弈,局中人i的策略空間:

該空間是個緊凸集。局中人i的效用函數:

容易驗證效用是s的連續(xù)函數和si的凹函數,因此也是si的擬凹函數。所以該博弈問題至少存在一個純策略納什均衡點[8]。
上面已經證明了系統博弈均衡點的存在性,現在的問題就是如何找到均衡點。一般來講求解納什均衡是個復雜度很高的問題,但根據前面介紹的博弈最優(yōu)響應動態(tài)可以部分地解決頻譜管理博弈均衡點求解問題。該思想最早由Yu Wei等提出并用于處理DSL中的功率控制問題,也是目前為止應用最廣泛的方法之一[9]。
對于次用戶i而言,當其他次用戶的策略固定后,最優(yōu)響應就是如下優(yōu)化問題的解:

因為假定其余次用戶策略不變,所以次用戶i的效用函數的分母是個常數,該優(yōu)化問題就是一個凹問題,與信息論中經典的并行信道最優(yōu)功率分配問題類似,采用拉格朗日乘法可以得到解為[10]

有了最優(yōu)響應函數,下面的問題就是如何讓次用戶同時滿足最優(yōu)響應條件。該過程可以采取兩種迭代方案實現,一種是Gauss-Seidel迭代方法,另一種是Jacobi迭代方法[11]。
1)Gauss-Seidel方法:每個博弈階段,僅有一個次用戶依據最優(yōu)響應函數更新策略,其余次用戶保持不變[12]:

2)Jacobi方法:每個博弈階段,所有次用戶認為其他次用戶的策略不變,同時按最優(yōu)響應函數更新策略[13]:

根據這兩種不同的方法,可以得到兩個求解納什均衡點的迭代算法[14]。
(1)采用Gauss-Seidel迭代方法
對所有次用戶,初始化功率分配向量 pi=0,初始化迭代次數t=0。
重復迭代

(2)采用Jacobi迭代方法
對所有次用戶,初始化功率分配向量 pi=0,初始化迭代次數t=0。
重復迭代

兩種算法可統稱為迭代注水算法。兩種算法的區(qū)別主要在于次用戶更新策略的順序不同,算法1中用戶i要等前i-1個用戶完成更新后才計算更新自己的最優(yōu)策略,算法2中所有次用戶都在同一時刻計算最優(yōu)策略并更新。因此當網絡中次用戶數較多時,算法2的速度要更快,但這種迭代方式也更容易進入循環(huán)狀態(tài),從而不能收斂。對于兩種算法,都要求次用戶相信,在自己更新功率時,其余次用戶保持先前策略不變,該要求在實際中是合理的。如果有多個均衡點,兩種方法收斂到的均衡點不一定相同。初始點不一定要選用零點,這里選用零點僅是為了簡單[15~16]。
本文在基于功率制約的信息系統柔性構型方法研究過程中,給出了求解納什均衡點的迭代注水方法,納什均衡的基礎是完全信息非合作博弈。完全信息,具體到迭代注水算法中就是次用戶發(fā)送端要可以準確得到目標通信對間的信道功率增益及各個信道受到的干擾。然而在實際信息系統中,完全準確地估計信道功率增益是不可能的,估計值或多或少都會有誤差存在,此時完全信息非合作博弈已經不再適用描述這種情況。信道估計值存在誤差,可理解為次用戶的信息不完全。傳統博弈論中,處理不完全信息的工具是由Hars提出的貝葉斯博弈,該博弈使用概率論的方法建模系統中參數的不確定性,因此該方法要求有不確定性參數的概率分布信息,這往往使得處理的問題變得非常復雜,而且概率分布信息能否得到也是個問題。對此在下一步研究中可以使用穩(wěn)健博弈的方法處理信息不完全性。