康亞威, 姚彥鑫
(北京信息科技大學 信息與通信工程學院,北京 100101)
能量收集技術使無線設備能夠從其環境中的自然資源中獲取所需的能量并儲存在電池中用于將來使用。這一技術使無線傳感器節點的使用壽命大大增加,且提高了能量的利用率[1]。現階段針對此技術的研究已經成為一個新的研究熱點,如何高效利用儲存的能量成為一個亟待解決的問題。
由于能量收集具有隨機性的特點,能量收集通信系統與傳統的通信系統相比需要設計良好的能量調度策略,在隨機能量收集情況下使吞吐量最大化。傳輸過程中,可用能量不能消耗太快,否則可能會由于能量短缺使傳輸中斷。但是假如能量消耗得太慢,電池的能量會大量溢出,引起能量的浪費以及錯過下次能量收集機會[2-3]。此類問題在近期的文獻中得到了廣泛的研究。文獻中考慮的情形主要分為在線和離線兩部分。離線情況下,雖然現有的研究中提出計算最優離線調度的算法[4-7],但是此類算法計算量大;在線情況下,由于未來的能量到達為未知且隨機的,需要動態地確定能量調度方案。
最佳的能量調度方案為傳輸功率隨時間保持恒定,同時確保不會由于電池容量有限而溢出[4]。文獻[5]中對于特定的馬爾科夫決策過程(Markov Decision Process, MDP)制定了最大化吞吐量的在線解決方案,文獻[6-7]中在此基礎上與動態規劃相結合,研究了在衰落信道下吞吐量最大化的策略,但此類方案只是在特定模型下實現最優,不能緊密貼合實際場景。而當能量收集為全隨機模型時,文獻[8]中提出了一種應用于一般遍歷的平穩過程,證明電池趨于無窮大的漸進最優。文獻[9-10]中證明離線最優解可以用多個不同的水位表示,并且將注水法與能量分配相結合,得出離線最優策略。文獻[11]中考慮了能量傳輸成本,用凸優化得出最優策略,但上述策略的計算量都比較大,占用計算空間。文獻[12]中提出了一個更為簡單的能量調度策略(Fixed Fraction Policy,FFP),用于能量收集為獨立同分布(i.i.d.)時的情況,此策略被證明可以與最佳長期平均吞吐量保持恒定的間隙,但此方案僅在能量到達符合獨立同分布(i.i.d.)時適用。此外,多用戶場景[13]以及MIMO信道預編碼策略[14]的離線優化進展明顯。
本文提出了一種簡單高效的離線能量調度策略。假設能量到達呈周期性變化時,每個周期T看作一個傳輸階段,階段內能量到達近似相等,各階段之間能量到達符合隨機模型。此模型近似可看作太陽能能量收集情況,在一定時間內太陽能輻射近似不變,在下一時間段由于受到云層的遮擋等影響而隨機產生變化。本文結合了FFP算法簡單高效的特點,針對其只適用于能量收集為(i.i.d.)的特點進行了改進。
考慮具有能量收集的無線傳感器網絡節點之間單信道的傳輸的場景,目標是最大化系統運行時期預期吞吐量。傳感器節點配備有限存儲容量的可充電電池。假設能量收集發生在每個時隙的開始,信道狀態保持恒定不變。每個傳輸階段共有T個時隙,每個時隙均進行能量的收集和調度。用Ek表示在第k個階段的能量收集,且Ek在該階段的時隙保持不變。在第k階段的第i時隙結束時,數據到達發射機,發射機通過收集并存儲的能量進行數據傳輸,數據通過靜態信道傳輸至接收機,如圖1所示。

圖1 具有能量收集和數據到達的EH通信系統

(1)
0≤Ek≤B,k=1,2,…,K

(2)
式中:W為信道的帶寬;N0為高斯信道的噪聲功率譜密度。對于策略集合P,可以定義當總傳輸時間為N,且能量收集為E1,E2,…,EN時的總吞吐量為
則同一策略的長期平均吞吐量可定義為
(3)
本文的目標是得出最優的離線能量調度策略以及最大吞吐量,即

(4)
由于恒定功率傳輸數據,且能量沒有溢出時系統吞吐量最大,根據FFP策略的理論證明,對于時隙t中電池的現有能量bt取固定的比例q(q∈[0,1])的能量進行數據傳輸可實現次最優的實驗效果,其離線策略pt表示為
pt=qbt,t=1,2,…
(5)
結合本文的模型,當能量收集Ek
(6)

由式(6)得出在傳輸階段k內能量溢出的限制條件為
(7)
當滿足此條件時,可以將第k階段T時隙的電池狀態表示為
(8)
根據式(7)以及(8)可得出當能量溢出時,能量的調度策略為
(9)
為表示方便,將Q定義為
(10)

(11)

(12)
由式(9)與(11)得出qk的表達式為
(13)
當滿足式(13)時,qk的取值可以確定在當前傳輸階段能量不發生溢出,即滿足式(7)的限制條件。

(14)

根據式(7)且已知能量收集分布,可以將qk取值范圍表示為
(15)
k=1,2,…,K-1
根據能量收集的分布模型,結合式(13)以及(15)建立qk的取值范圍如下:
(16)

當進行到傳輸最后一個階段,即第K階段時,能量溢出的條件為式(7),則制定新的能量調度策略,將此階段按照恒定功率的策略進行傳輸數據,其傳輸策略為:
(17)
綜上,本文的能量收集模型建立以下的能量調度策略:
(18)
為了驗證文中能量調度策略的性能,將本文算法與最優離線算法[4]和貪婪算法[15]進行對比。為了便于表示,將改進的FFP算法設為方法1,最優離線算法設為方法2,貪婪算法設為方法3。
在數值分析中,使用基于IEEE802.15.4e[16]通信系統的參數。將傳輸階段長度設定為1 h,每個階段共有T=5個時隙,每個時隙時間為12 min,可用帶寬W=1 MHz。電池容量B=36 MJ,信道的增益為H=1.655×10-13,噪聲功率密度N0=10-20.4W/Hz,則根據式(3)可計算吞吐量。能量到達分布為太陽能輻射監測實驗室網站下載的現實數據,此數據近似符合本文的能量收集分布模型。將能量數據對3個算法分別進行仿真,其太陽能能量收集分布如圖2所示。

圖2 能量到達分布圖
將傳輸階段分為k=20個階段,在數據傳輸過程中,對能量收集的分布使用方法1與方法2進行傳輸,兩種算法在傳輸階段內的總吞吐量與階段數的關系如表1所示。

表1 方法1吞吐量占方法2的比例
由圖3可以清晰地得出方法1具有高效的傳輸效率,在整個傳輸階段中,方法1的吞吐量曲線緊貼方法2。當傳輸階段k=20時,方法2的吞吐量比方法1高0.01 GB。根據表1可得出方法1在能量隨機變化的情況下,傳輸效率保持穩定,吞吐量約占方法2的99%左右。

圖3 方法1與方法2吞吐量對比
根據圖4得出,方法1的策略整體上跟隨方法2的變化趨勢,能量利用率均為100%,但是曲線的趨勢仍有背離的部分,例如時隙t=1~10的部分,方法2保持恒定傳輸,方法1則出現波動,這就是方法1與方法2吞吐量出現差距的原因。

圖4 方法1與方法2傳輸功率對比
其他仿真條件不變,根據能量到達分布,將方法1與方法3進行對比,其仿真結果如圖5所示。

圖5 方法1與方法3吞吐量對比
由圖5可得,方法1相對方法3吞吐量具有明顯的提升,在傳輸階段中,雖然方法3的吞吐量曲線與方法1的軌跡大致相同,但是吞吐量差距很大。當傳輸階段k=20 時,方法1的吞吐量比方法3提升0.178 GB。根據表2可得出方法1其吞吐量較方法3至少提升110%。

表2 方法1吞吐量較方法3吞吐量的提升
根據圖6可得兩種算法的傳輸功率趨勢大致相同,能量利用率均為100%。但是當太陽能能量到達為0時,方法1為恒定的非0的功率,而方法3的對應時隙的功率則為0,此為方法1與方法3吞吐量出現明顯優勢的主要原因。

圖6 方法1與方法3傳輸功率對比
圖7展示了電池電量B對預期數據傳輸總量的影響。可見,對于所提出的算法,預期數據傳輸總量隨電池容量B增加而增大。總的來說,方法1的性能約是方法2的99%。

圖7 電池大小對吞吐量的影響

(2) 方法2計算量。設電池共M個狀態,即單個階段傳輸功率可有M種情況。方法2類似于用窮舉法將每個階段可能的傳輸功率情況進行枚舉,找出在有限長的傳輸階段下最優的傳輸策略。當傳輸階段為k=N時,方法2中加法的計算次數為2NM,乘法的計算次數為4NM,對數運算的計算次數為NM。
(3) 計算量對比分析。相對來說,對數運算的計算量要大于乘法運算,加法運算的計算量最小。因此,只考慮乘法和對數運算。當電池狀態數M=4時,方法2的計算量就必定大于方法1,可以得出電池的狀態不僅僅只有4種,當電池的狀態越多時,方法1計算量降低便會越大,大大提高了策略的時效性,節省了計算空間。
為了比較方法1與方法2在運算時間上的差距,首先設定電池的狀態數M,而后對算法中運算的時間進行對比。由表3的數據分析得知,隨著電池狀態的增加,方法1運算時間幾乎不變,而方法2的運算時間增長迅速。由此可得出,當電池狀態越多時,方法1更加節省計算量以及運算時間。

表3 兩種算法運算時間 s
本文考慮了能量隨機收集的通信系統,其中發射機具有能量收集裝置和有限容量的電池。當信道為靜態信道時,著力對傳輸階段總傳輸數據最大化問題進行了研究。針對離線優化問題,對文中所述能量收集模型的功率控制在原有FFP算法的基礎上進行了改進,確定了次最優的傳輸策略。其性能可以達到最優離線算法的99%,比傳統的貪婪策略性能至少提升約110%,并且分析了改進的FFP算法與其他算法產生吞吐量差異的原因。最后,進行了計算量與算法運算時間的對比,下一步的研究工作是在此基礎上找到最優的在線能量調度策略。