邢志浩,楊博文,楊 堅
(中國科學技術大學 自動化系,安徽 合肥 230027)
為解決用戶設備的異構性和網絡狀況的時變性,可伸縮視頻編碼(Scalable Video Coding, SVC)[1]成為了現代視頻傳輸系統中一個有吸引力的解決方案。許多研究[2-4]關注于長期演進(Long Term Evolution, LTE)系統中SVC傳輸的資源分配問題,但這些方法不考慮視頻服務器的層數選擇,視頻服務器須向基站傳輸包含所有層數的SVC視頻,這無疑增大了回傳網絡的負擔。
由于上述原因,有一些研究同時關注SVC視頻的層數選擇和LTE資源分配。文獻[5]提出了一種在LTE系統下傳輸SVC視頻的跨層設計,但該算法僅僅根據用戶反饋的信道質量進行層數劃分,然而由于無線基站資源有限,用戶的信道質量高并不意味著能獲得充足的帶寬。文獻[6]提出了一種層數選擇和跨層資源分配算法,與傳統算法相比,該算法具有視頻質量高且中斷率小的優點,但其層數選擇部分并未利用跨層信息,決策效果受到影響。
在本文中,首先針對在LTE系統中傳輸SVC視頻的場景,以服務質量為優化目標建立視頻層數選擇和資源分配的問題模型。進一步地,考慮到視頻層數選擇和資源分配的時間尺度差異很大,利用李雅普諾夫優化方法將問題分離成兩個子問題。通過對子問題特性的分析,設計并實現了一種視頻層數選擇和資源分配算法。最后,通過對比實驗驗證本文提出的視頻層數選擇和資源分配算法的效果。
本文考慮單個LTE基站對多用戶傳輸SVC視頻的場景。系統架構圖如圖1所示。N個用戶同時連接到基站,向視頻服務器發起不同的視頻請求。基站根據無線信道的狀況對用戶進行資源分配;而視頻服務器則依據基站返回的跨層信息進行視頻層數的選擇,從而實現碼率自適應。本節針對這一場景建立問題的數學模型。

圖1 系統架構圖
本節主要介紹LTE系統模型。為減少信令開銷,子載波被聚合成資源塊(Resource Block,RB)。調度器每隔1 ms進行一次調度,這個周期稱為傳輸時間間隔(Transmission Time Interval, TTI)。通常,調度器以兩個在時域上連續的RB為調度的最小單位,這兩個連續的RB被稱為調度塊(Scheduling Block, SB)。設一個TTI內,所有可用的SB集合為I={1,2,…,I}。
LTE中速率的配置通過調制與編碼策略(Modulation and Coding Scheme, MCS)索引值實現,一旦為調度塊i選擇了MCS索引j,它的傳輸速率r(j)也就隨之確定[7]。其中j∈{1,2,…,J},代表最大的MCS索引。MCS索引越大,則碼率越高,r(j)也越大,編碼的冗余度則越小。
每個用戶根據各SB塊級別的等效信號與干擾加噪聲比(Signal to Interference plus Noise Ratio, SINR)估計出可以選擇的最高MCS索引,并將這個最高MCS以信道質量指示(Channel Quality Indicator, CQI)的形式向基站上報。等效SINR與MCS、CQI的映射表可見參考文獻[8]中的表1。用閾值Γj表示MCS索引取j時,使塊誤碼率(Block Error Rate, BLER)小于10%的最小SINR。則對于用戶n而言,調度塊i的SINR為γn,i時,可以選取的最大MCS索引可以表示為:
Jn,i=max{j|Γj≤γn,i,j=0,1,2,…,J}
(1)
其中,Γ0等于負無窮,對應的MCS索引j=0表示超出范圍,傳輸速率視為0。
在LTE系統的MCS選擇中,有一個重要約束,即在一個TTI內,所有分配給同一用戶的SB必須選擇相同的MCS[9]。令bn,j(t)∈{0,1} 表示第t個TTI時用戶n的MCS選擇,bn,j=1表示用戶n選擇MCS索引j,bn,j=0 則相反。由于一個用戶只能選擇一個MCS,因此有:

(2)
令an,i(t)∈{0,1}表示第t個TTI時調度塊的分配,an,i=1表示將調度塊i分配給用戶,反之則表示不分配。因為一個調度塊最多只能分配給一個用戶,所以an,i滿足

(3)
其中,N={1,2,…,N} 代表用戶的集合,N為用戶總數。
為避免過大的誤碼率,如果一個調度塊采用了過高的MCS,則它的速率被視為0,從而用戶n在第t個TTI時的比特率可以表示為:
(4)
由于第二個求和符號的上限是Jn,i,選取超過Jn,i的MCS會導致求和的結果為0。
為實現碼率自適應,采用SVC技術來得到不同速率的碼流。視頻以質量可伸縮的方式被編碼為L層,其中包括一個基本層和L-1個增強層。通過增加和減少視頻層數,視頻碼率得以適應網絡狀況的變化。
由于一個圖像組(Group of Pictures, GoP)內視頻幀的相互依賴,視頻碼率的決策一般以GoP為粒度進行。為保證視頻的壓縮率,GoP通常包含10幀以上的數據,至少持續上百毫秒。另一方面,LTE資源調度在每個TTI進行,而一個TTI僅持續1 ms,這意味著資源分配要比層數決策頻繁得多。為方便起見,假設GoP的持續時間是TTI的整數倍,一個GoP包含T個連續的TTI。從而,視頻層數的決策每隔T個TTI進行一次。
視頻層數決策僅在第(k-1)T+1個TTI的開始進行,其中k為正整數。第k個GoP決策后的T個TTI滿足t∈[(k-1)T+1,kT]。用第k個GoP的平均視頻比特率代表這個時間段的視頻碼率:
ωn(t)
(5)

qn(t)
(6)

如果選取的視頻碼率持續大于用戶可用的比特率,則客戶端的播放會發生中斷,進而導致服務質量的下降。為此,引入一個約束來避免中斷的發生:
(7)

系統的瞬時效用定義為所有用戶的視頻質量之和:
(8)
從而系統的時間平均效用定義為:

(9)
在傳輸速率約束(式(7))和資源分配約束(式(2)、式(3))下,聯合優化層數選擇和資源分配,以最大化系統的時間平均效用。系統效用最大化的問題可以描述為:

(10)
(11)
顯然,式(10)是一個隨機優化問題,在對信道情況的分布沒有先驗知識的情況下難以求解。為此,本文算法不依賴先驗統計知識,而使用在線的方法求解。
本節基于李雅普諾夫優化理論,提出一種雙時間尺度的算法。首先利用李雅普諾夫漂移將問題分離成兩個子問題,再根據子問題的特性進行求解。
為利用李雅普諾夫優化方法求解式(10),引入一個虛擬隊列Hn(t),將時間平均約束式(7)轉化成隊列穩定性約束。隊列Hn(t)的遞推關系如下:
Hn(t+1)=(Hn(t)+ωn(t)-rn(t))+
(12)
其中(a)+max(a,0)。根據參考文獻[10],隊列Hn(t)的平均速率穩定意味著時間平均約束式(7)成立。為分析隊列穩定性,引入李雅普諾夫函數
(13)
令H(t)(H1,H2,…,Hn)表示所有用戶t時刻的虛擬隊列長度,則T個TTI內的條件李雅普諾夫漂移定義為這段時間內李雅普諾夫函數變化的期望:
ΔT(t)E[L(t+T)-L(t)|H(t)]
(14)
根據李雅普諾夫漂移理論,時間平均約束式(7)可以轉化為最小化李雅普諾夫漂移ΔT(t)。由于目標是在式(7)約束下最大化系統效用,將漂移ΔT(t)與目標函數相結合,如下式:
(15)

在每個TTI進行資源分配時,可以通過用戶反饋的CQI估計信道質量,根據當前的觀測進行決策;然而,視頻的層數選擇每隔T個TTI才執行一次,決策時難以知道未來T個TTI的虛擬隊列長度。為解決這個困難,采取參考文獻[11]中的思想,將當前的隊列長度作為未來隊列長度的近似,以得到公式(15)的一個松弛的上界。下面給出這個上界和證明過程。
定理1令t=kT,k為非負整數。在任意可行決策下,有
(16)
其中正常數B定義為B
證明:將虛擬隊列的遞推公式式(12)兩邊取平方并展開,可以得到

(17)
那么,
(18)
將上式兩邊減去效用U,并在[t,t+T-1]區間內求和,稍作整理可得:
(19)
其中,Aleft表示式(15),B1
接下來,對式(19)的右半部分,用Hn(t)來近似Hn(τ),以得到更寬松的條件:
Hn(t)-(τ-t)rmax≤Hn(τ)≤Hn(t)+(τ-t)ωmax
(20)
從而有:
(21)
(22)
將式(21)、式(22)帶入式(19),即得到式(16)。定理1得證。
根據李亞普諾夫漂移和優化理論,聯合優化問題的決策可以通過最小化上界式(16)得出,而無須直接最小化公式(15)。
可以觀察到,定理1中上界式(16)右邊的第二項僅與視頻層數決策ln相關;而最后一項則與SB分配an,i和MCS選擇bn,j相關。由于這樣的特殊結構,優化問題可以被分離成兩個并行的子問題,一個是視頻層數選擇問題,另一個是LTE資源分配問題。
2.2.1視頻層數選擇
基于前述上界(16)的特性,層數選擇決策可以通過最大化式(16)右邊的第二項得到。即在第t個TTI(t=(k-1)T+1,k=1,2,…)時,求解以下問題:
(23)
s.t.ln(t)∈Ln,?n
(24)
在式(23)的目標函數中,第二項是虛擬隊列長度乘以視頻比特率,由李亞普諾夫漂移引入,起到穩定隊列的作用。較大的V使決策傾向于選擇更高層數以改善用戶視頻質量,而較小的V更利于虛擬隊列的穩定。
由于每個用戶的層數決策相互獨立,式(23)可以進一步分離成N個子問題。通常而言,在實際系統中視頻的總層數不會太多,因此,視頻層數的決策可以通過遍歷所有可行的層數得到。并且,層數決策每隔T個TTI才會執行一次,因此,層數選擇的計算開銷非常低。
2.2.2LTE資源分配問題
SB分配和MCS選擇可以通過最小化式(16)中的最后一項來得到。將式(4)帶入式(16)的最后一項,LTE資源分配問題可以描述為:
(25)
(26)
問題中的目標函數可以視為用虛擬隊列長度加權了的用戶速率。在資源分配問題中,如果像層數選擇一樣采用GoP開始時的虛擬隊列長度進行決策,則會造成在一個GoP內資源過多地向隊列長的用戶傾斜。所以,必須采用每個TTI實際的虛擬隊列長度,這樣當一個用戶得到過多調度時,其虛擬隊列的長度會相對變短,其他用戶就會得到調度,從而保證算法的公平性。
首先,式(25)是一個非線性問題,難以直接取得最優解。根據文獻[7]和文獻[12]的闡述,通過換元法,可將該問題轉化成一個整數線性規劃問題。然而,求解整數線性規劃需要消耗大量的計算量。同時,如果MCS約束式(2)不存在,即同一TTI內分配給同一用戶的SB可以選取不同的MCS,式(25)可以進一步分離為I個子問題,每個子問題對應一個SB的調度。這樣一來,無論調度塊i分配給哪個用戶n,都可以選取最高MCS 索引Jn,i;從而,為最大化目標函數,調度塊i應該被分配給虛擬隊列和速率乘積最大的用戶,即
(27)
根據上述原因,本文借鑒了文獻[8]中的思想來解決這個問題,采用一種次優方法進行資源分配,描述如下:
(1)對于每個SB,按照式(27)進行SB的分配;
(2)對于每個用戶,根據分配給它們的SB的CQI,估計出這幾個SB的SINR值γn,i,根據式(1)有:
γn,i≈Γj+ΔΓ,j=Jn,i
(28)
其中ΔΓ是加在閾值Γj上的一個正偏移量。

(29)
(30)
其中,Jn為用戶n最終選擇的MCS。
上述資源分配算法只需要遍歷用戶即可確定一個SB的分配;對于每個用戶MCS的選擇,也只需要進行調和平均數的計算和查映射表的操作。因此,該資源分配算法具有較高的效率。
通過仿真實驗模擬多用戶連入同一個資源有限的基站進行不同視頻請求的場景,以驗證本文所提出的層數選擇和資源分配算法的有效性。然后通過對比實驗評估本文所提算法的性能。
在仿真實驗中,考慮單個LTE基站,用戶隨機散布在基站覆蓋范圍內。一個TTI中有25個可用SB(即將頻域劃分成25個RB),每個RB有12個子載波,相應仿真參數如表 1所示。

表1 LTE仿真參數
對于SVC視頻,選取了幾個參數相同的視頻流,視頻編碼器的設置如表 2所示。連入基站的用戶隨機選擇一個視頻發起請求,緩沖區達到10個GoP時開始播放,并持續播放100個GoP。

表2 SVC編碼器設置
為評估所提算法的性能,將實驗結果與QCLS算法[6]進行對比。用PSNR作為視頻質量的衡量指標,在用戶數不同的情況下進行實驗,平均PSNR如圖2所示。從圖2可以看出,本文所提算法的PSNR整體優于QCLS算法。QCLS算法的性能依賴于R-D模型的擬合效果,然而R-D曲線難以表現出視頻碼率和質量隨時間的變化。而在本文算法中,這些信息將實時影響隊列長度,從而影響決策。

圖2 所有用戶的平均PSNR
除視頻質量以外,中斷率也是影響服務質量的重要指標,圖3展示了兩種算法在不同用戶數下的中斷情況。本文算法的中斷率較少,這說明本文提出的算法通過確保虛擬隊列的穩定性來使公式(7)成立,能有效地防止中斷的發生。

圖3 所有用戶的平均中斷GoP數量
同時,采用最小-最大指數[6]作為公平性指標對算法的公平性進行比較。仿真結果如圖4所示。可以看出,本文所提算法的公平性要優于QCLS算法。如式(25)下方所討論的,當一個用戶過多地得到調度時,其虛擬隊列長度將會變短,從而使虛擬隊列長的用戶得到調度,保證了算法的公平性。

圖4 公平性指標
本文基于李雅普諾夫優化理論,針對在LTE網絡中傳輸SVC視頻的場景,提出了一種層數選擇和資源分配算法。通過對比實驗,表明本文所提的算法提升了視頻的PSNR,保證了視頻的流暢播放,同時具有較好的公平性。