QoE感知的V-CRAN視頻傳輸資源分配策略

2022-07-04 05:49:38王汝言徐瑞鑫李職杜

西安電子科技大學學報 2022年3期

張鴻，黃闖，鄒虹，王汝言，徐瑞鑫，李職杜

(1.重慶郵電大學通信與信息工程學院，重慶 400065；2.先進網絡與智能互聯技術重慶市高校重點實驗室，重慶 400065；3.泛在感知與互聯重慶市重點實驗室，重慶 400065)

隨著在線、移動和實時社交媒體的快速發展，以視頻為代表的富媒體逐漸成為互聯網內容的主流[1]。根據思科視頻網絡指數預測的結果，2022年全球視頻流量將占全網流量的82%[2]。為了保證用戶觀看視頻的體驗質量，無線網絡傳輸需要具備超高的數據速率、低時延和大容量的特點[3]。面對上述挑戰，采用時波分復用無源光網絡(Time and Wavelength Division Multiplexed Passive Optical Network，TWDM-PON)作為前傳的云無線接入網(Cloud Radio Access Network，C-RAN)被認為是滿足低時延、高數據速率和大容量的有效解決方案[4]。但是，面對不斷增加的視頻數據流量，用C-RAN有限的前傳能力和無線資源給用戶提供平滑高質量的視頻體驗質量產生了巨大的挑戰[5]。

對于視頻業務而言，其最終目的是給用戶提供一個平滑和高質量的視頻播放體驗。在無線域，文獻[6]中提出了一種基于速率的動態比特率自適應流策略，實現了高效與低成本的視頻流傳輸，但在一些緩沖區空間較小的設備上，當速率控制沒有及時根據吞吐量調整，此時易造成用戶緩沖區中斷或溢出。因此，文獻[7]中設計了一種比例-積分-微分策略，通過穩定用戶播放緩沖區的長度來保證視頻的連續播放。雖然它增強了用戶觀看視頻的連續性，卻忽略了視頻的質量。為了解決該問題，文獻[8]中提出了雙時間尺度的資源優化策略，將軟件定義網絡(Software Defined Network，SDN)引入到無線網絡，利用軟件定義網絡控制器感知網絡中的環境變化，同時設計了一種李雅普諾夫在線算法，以獲得每個時間尺度的視頻質量和帶寬分配決策來提高用戶的平均視頻質量。然而，上述文獻都是針對無線域的資源分配來增強用戶的體驗質量(Quantity of Experience，QoE)的。采用TWDM-PON作為前傳的C-RAN架構，應充分考慮光域和無線域協作來提升網絡的性能。因此，文獻[9]中設計了一個基于軟件定義網絡的C-RAN架構，利用軟件定義網絡控制器感知網絡中光域和無線域的資源，并且對C-RAN架構中的無線層和傳輸層進行聯合調度和管控，但是對波長資源和無線資源無法實現共享，各個服務提供商(Service Provider，SP)獨立運行C-RAN，造成資源利用率不高，無法保證用戶的體驗質量。為了解決該問題，文獻[10]在基于軟件定義網絡的C-RAN架構上，利用網絡虛擬化技術(Network Virtualization，NV)將基礎設施和空閑的頻譜資源形成虛擬化切片，用于無線資源拍賣以保證用戶的服務質量，但是該策略沒有考慮光域資源的虛擬化。因此，在光域與無線域中，文獻[11]中設計了一個C-RAN與NV的聯合架構，在保證用戶服務質量的前提下，依據負載流量為不同類型的虛擬化云無線接入網(Virtualization C-RAN，V-CRAN)公平地分配資源。然而，該策略并不適用于以用戶為中心的視頻流服務。因此，文獻[12]中設計了一個端邊云協作的C-RAN架構，考慮用戶簇切換時的零緩沖中斷時間與網絡的頻譜效率構建虛擬無源光網絡(Virtualized Passive Optical Network，VPON)，利用網絡虛擬技術有效地降低了光域的波長數目，同時提高了無線鏈路的頻譜效率，減少了用戶觀看視頻的中斷時間。然而，該技術卻忽略了光網絡單元(Optical Network Unit，ONU)的調諧范圍，過多的簇切換會產生較大的波長調諧開銷。

綜上所述，雖然基于TWDM-PON前傳的C-RAN架構下能夠有效地向用戶提供高質量的視頻傳輸，但仍存在光域和無線域資源分配不平衡的問題，從而影響用戶觀看視頻時的體驗質量。因此，在基于軟件定義網絡的TWDM-PON前傳的C-RAN架構下，筆者提出一種體驗質量感知的虛擬化云無線接入網視頻傳輸資源分配策略(Qoe-Aware Video Transmission Resource Allocation Strategy，QAVTRAS)。首先根據用戶請求的視頻質量、帶寬需求，考慮前傳帶寬分配效率、調諧開銷以及負載均衡性優化波長資源的分配，提出基于合并分裂規則的聯盟形成博弈構建V-CRAN；進而，建立V-CRAN和用戶之間的Stackelberg博弈模型，通過定價策略優化無線帶寬分配，保證用戶體驗質量；最后求解納什均衡，得到雙方各自最優的策略。

1 基于TWDM-PON的C-RAN跨域協作傳輸架構

基于TWDM-PON前傳的C-RAN網絡如圖1所示。TWDM-PON可為C-RAN提供高容量、低時延的前傳支持，以滿足視頻業務的傳輸需求。在無線域中，每個RRH從小區中的用戶接收射頻信號之后，傳輸到光網絡單元形成數字基帶信號。利用公共無線接口(Common Public Radio Interface，CPRI)將數字化的基帶信號轉發到基帶單元池[13]。在光域，光線路終端(Optical Line Terminal，OLT)負責分配波長資源[14]。利用TWDM-PON的高容量特性，多個光網絡單元利用波長調諧器調諧到同一波長或波長組形成VPON，以時分復用的方式共享該波長，并通過遠端節點(Remote Node，RN)將上行/下行數據流量傳輸到光網絡單元[15]。

圖1 基于TWDM-PON前傳的V-CRAN架構

與現有架構不同的是，基帶單元池虛擬化成若干個虛擬基帶單元(virtualized BaseBand Units，vBBUs)。當小區處于輕負載或重負載的情況時，虛擬化小區(Virtualized Cell，VC)動態地控制vBBU和線卡(Line Card，LC)的關聯。其中，虛擬化小區負責管理一組vBBUs，相應地控制一組波長信道連接到RRH。

為了實現光域和無線域的協同調度和優化，筆者提出支持軟件定義網絡的C-RAN網絡為資源和用戶提供了一個資源交易的平臺。軟件定義網絡控制器通過資源調度為不同的VPON分配波長組，并與之相關聯的虛擬化小區形成V-CRAN。其中，每個V-CRAN代表一個服務提供商。在資源調度過程中，用戶首先向軟件定義網絡控制器發送調度請求，請求信息包含用戶請求的視頻質量、播放緩沖區的大小、信道質量信息以及帶寬需求；其次，軟件定義網絡控制器計算前傳帶寬分配效率、波長調諧開銷以及波長間的負載均衡程度，通過基于合并分裂規則的聯盟博弈構建V-CRAN，優化波長資源的分配。一旦V-CRAN構建完成，將用戶和V-CRAN建模為兩階段的Stackelberg博弈，根據用戶播放緩沖區的大小，定義用戶視頻中斷危險程度參數，進一步優化無線資源的分配。最后，軟件定義網絡控制器將光域和無線域的資源分配決策通過傳輸控制器和無線控制器向光網絡單元進行廣播，每個光網絡單元只處理與它連接RRH的調度決策。

2 基于聯盟博弈的V-CRAN波長分配算法

在基于TWDM-PON前傳網絡的C-RAN網絡中，過多的波長開啟將會導致較大的能耗開銷和較低的資源分配效率。而形成V-CRAN能夠共享波長資源，減少波長的使用量。同時，為了實現波長資源和無線資源的協同分配，通過考慮用戶請求的視頻比特率和期望的無線帶寬數量構建波長資源和無線資源的下行帶寬分配效率模型。然而，由于每個光網絡單元的調諧范圍不一樣，在分配波長的時候容易造成較大的波長調諧開銷或較差的波長負載均衡性。因此，為了優化激活的波長數目和波長調度引起的開銷，考慮前傳帶寬分配效率、調諧開銷和負載均衡性，筆者提出基于合并與分裂的聯盟形成算法。

2.1 前傳帶寬分配效率

在V-CRAN構建的過程中，根據用戶請求的視頻比特率大小和所期望得到的帶寬數量創建V-CRAN。假設G={g1，g2，…，g|G|}，|G|是V-CRANs的集合；|W|是波長的數量，W={w1，w2，…，w|W|}。V-CRANgi是由ni個RRH/光網絡單元組成的，根據文獻[16]定義當前V-CRANgi下的前傳帶寬分配效率E(gi)，表示為波長承載每單位無線帶寬所減少的使用數量：

(1)

2.2 波長調諧開銷

(2)

2.3 負載均衡性

當負載一定時，激活波長的數目隨波長分配方案的不同而變化。為了均衡不同波長間的負載量，利用均方誤差來衡量當前場景下不同虛擬光網絡間的負載失衡度[18]：

(3)

2.4 聯盟博弈算法

聯盟形成是一種基于合作的博弈算法，通過光網絡單元之間相互協作形成V-CRAN，能夠共享波長資源，實現資源的高效利用。因此，根據前傳帶寬分配效率、波長調諧開銷和負載均衡性將V-CRAN的構建過程轉化成聯盟博弈問題，并通過合并與分裂規則得到最優的V-CRAN分配方案。

(1) 聯盟模型

用(I，U)表示聯盟博弈。I為博弈的參與者，即在任意的Ti和Ti+1之間，波長分配方案的集合I={σ1(o，w)，…，σ|O|(o，w)}，其中{σj(o，w)，o∈O，w∈W}表示波長wj分配給oj用于前傳數據的傳輸。U表示該集合的效用值，根據前傳帶寬分配效率、波長調諧開銷和負載失衡度建立V-CRANgi的效用函數：

U(gi(Ω))=αE(gi(Ω))-βT(gi(Ω))-γB(gi(Ω)) ，

(4)

其中，gi(Ω)表示V-CRANgi中σ(o，w)的集合。α+β+γ=1，可通過調節a，β，γ的值來表征網絡的偏好程度。

在V-CRAN形成的過程中，選擇合作的標準是聯盟中的成員是否能夠獲得最大的個體效用或者該聯盟能夠達到最大化的網絡效用。為了便于描述聯盟機制，有如下定義[19]。

定義2(比較(Comparison)?)：假設集合I中兩種不同的聯盟結構A和B，比較?表示A和B的比較關系。若效用函數U(A)>U(B)，則稱A?B。

在聯盟博弈中，比較關系主要分為兩類：聯盟價值序列和個體價值序列。聯盟價值序列(如功利主義序列)追求的是網絡效用的最大化，而個體價值序列(例如帕累托序列)注重個體的效用值。形成V-CRAN是為了共享波長資源，達到資源的最優利用，因此不同集合之間選擇聯盟價值序列作為V-CRAN劃分的合并與分裂規則。

(2) 聯盟博弈規則

由上述定義，根據聯盟價值序列設計兩種聯盟規則。

(5)

(6)

筆者提出基于合并與分裂規則的聯盟形成算法，主要思想如下：初始狀態下每個σ(o，w)都相互獨立；在合并階段中，σ(o，w)向I中的其他σ|O|(o，w)嘗試形成聯盟。若加入該聯盟能夠增大整體聯盟的效用值，則進行合并。重復合并過程，直到遍歷完I且最大聯盟效用值不能再增加為止。接下來進行分裂，對于當前的聯盟結構中的每一個聯盟進行分裂。根據式(6)，若分裂能夠增大當前最大的聯盟效用值，則分裂成互不相交的小聯盟，直到分裂行為不再增加當前聯盟的效用為止。至此，一輪合并-分裂過程結束。算法經過多次的聯盟合并與分裂操作，直到此時的聯盟結構中所有聯盟沒有合并與分裂活動，則算法停止。

3 體驗質量感知的無線資源分配策略

在某個V-CRAN中，多個用戶共享該V-CRAN的無線資源，通過相互競爭最大化自身觀看視頻時的體驗質量。而每個V-CRAN作為服務提供商通過設置合理的資源價格為用戶提供服務。服務提供商和用戶的交互建模為兩階段的Stackelberg博弈模型。在第1階段，服務提供商公布資源的價格；第2階段，用戶根據服務提供商的價格響應資源需求以保證觀看視頻的體驗質量。因此，如何合理地分配無線資源，最大化服務提供商的效用，同時又能夠保證用戶的體驗質量顯得至關重要。因為每個服務提供商執行的都是相同的過程，所以只考慮在單個服務提供商下的無線資源分配。

3.1 體驗質量模型

無線帶寬的分配直接決定著關聯用戶對視頻質量的感知。當用戶的傳輸速率大于用戶請求的視頻比特率Rm時，此時速率的上升對用戶的體驗影響較為輕微，用戶的體驗質量隨著速率的上升緩慢增加[20]。但當用戶的傳輸速率小于視頻比特率Rm時，用戶對速率的提升有著迫切需求，此時用戶的體驗質量會隨著傳輸速率的下降而急劇減少。用戶的體驗質量與傳輸速率之間存在一種邊際效益遞減的現象[21]，用下式表示二者的關系：

(7)

其中，cm表示分配用戶m的帶寬比例，cm∈[0，1]；V表示用戶所能達到的最大傳輸速率。V表示為

(8)

其中，C表示該服務提供商的總帶寬大小，δ2為加性高斯白噪聲功率，PRRH表示RRH的發射功率，gm表示用戶m的信道增益，ζ表示其他RRH對用戶m造成的干擾。

此外，用戶體驗質量中的權重am與用戶的無線帶寬需求有關，表示為用戶的視頻中斷危險程度。視頻中斷危險程度am值越大，表明用戶m對體驗質量的需求越高，對無線帶寬的需求越迫切。為了進一步提高用戶的效用，除了考慮用戶請求的視頻質量，用戶緩沖區的大小同樣是影響體驗質量的關鍵因素。因此，視頻中斷危險程度am的定義如下：

(9)

3.2 基于Stackelberg博弈的無線帶寬分配算法

用戶在帶寬策略空間定義相應的效用函數，與傳統的最大化用戶加權速率和效用不同。針對視頻業務的傳輸，用戶的效用函數必須考慮視頻流的度量指標，因此定義如下的效用函數。

(1) 用戶的效用函數：用戶的效用函數由其收益和開銷組成，用戶m的收益定義為用戶觀看視頻時的體驗質量。因為其從服務提供商請求帶寬資源來保證自身的視頻質量，所以用戶m的開銷是用戶向服務提供商請求帶寬的數量所支付的費用。設p為服務提供商給出的資源單價，cm為第m個用戶所需要的無線帶寬需求量。因此，用戶的效用函數定義為U(pm，cm)，表達式為

Um(pm，cm)=Qm(cm)-pmcm。

(10)

因此，用戶的最優化問題為

(11)

(12)

(2) 服務提供商的效用函數：服務提供商的效用函數等于所有無線帶寬所獲得的收益，因此服務提供商的效用函數為

(13)

服務提供商的目標就是通過設置合理的無線帶寬價格滿足用戶的需求，以最大化自己的收益。因此，服務提供商的優化問題表示為

(14)

(15)

(16)

其中，約束式(15)是表示所有用戶的總需求不得大于總帶寬，約束式(16)是為了保證服務提供商的收益為正值。當服務提供商定價過高，將會導致用戶的需求量減少，使得網絡中較多的無線資源被閑置。而當定價過低，則會導致用戶的帶寬需求量過大，超過用戶請求的視頻比特率Rm，對用戶的效用增加不會太明顯。因此，在博弈過程中，服務提供商希望設置合理的價格來最大化自身的收益。

3.3 納什均衡解的存在性和惟一性

由于服務提供商的無線資源是有限的，所以并不能滿足所有用戶的最大帶寬需求。假設每個用戶都是自私的，都希望獲取更大的收益，支付更少的成本。因此用戶相互競爭無線資源，并通過非合作博弈達到納什均衡。在納什均衡點上，用戶和服務提供商的效用達到最優。但并不是所有的非合作博弈都存在唯一的納什均衡解，所以需要證明兩階段納什均衡點的存在性和唯一性[22]。

定理1對于給定的服務提供商的價格策略p*，在M個用戶博弈G={c1，c2，…，cM；U1，U2，…，UM}中，所有的m=1，2，…，M均有以下條件成立：

(1)cm在歐氏空間中是一個非且有界的封閉區間。

(2)Um是一個連續的凸函數。

證明：顯然，對于用戶的資源需求策略{cm}，有0≤cm≤1，因此滿足條件1。而且用戶的效用函數在其策略空間上是連續的，對任意用戶的效用函數求其一階偏導為

(17)

其二階偏導為

(18)

3.4 Stackelberg博弈問題的求解

逆向歸納法是求解完全信息狀態下Stackelberg博弈問題領導者和跟隨者最優策略的主要方法[23]。但是，需要每個參與者知道其他參與者的相關信息。利用C-RAN集中式架構的優勢，通過軟件定義網絡控制器可以獲取其他參與者的相關信息。因此，采取逆向歸納法，求得Stackelberg博弈的納什均衡解。

首先分析第2階段跟隨者的決策。假設在t時刻，服務提供商公布的資源價格為p(t)。這時用戶的資源需求策略通過設置?Um(pm(t)，cm(t))/?qm(t)=0，得到服務提供商下用戶m的最佳帶寬大小，使得效用最大化，其表達式記為

(19)

(20)

(21)

(22)

此時，服務提供商根據用戶的資源需求策略進一步通過價格迭代調節自身的價格，獲取更大的收益。服務提供商價格的變化率通過微觀經濟學邊際效用[24]表示。服務提供商的價格迭代方程為

(23)

其中，ω是服務提供商的價格策略調節系數。服務提供商的邊際效用可以通過價格的變化量ε(例如ε=10-4)來計算其對效用產生的影響。因此，基于價格的邊際收益[25]可以計算為

(24)

當用戶和服務提供商通過不斷的迭代達到納什均衡時，整個網絡也達到了均衡。

基于上述對V-CRAN的構建和無線資源的進一步優化，體驗質量感知的虛擬化云無線接入網視頻傳輸資源分配策略QAVTRAS流程如下：

(1) 初始化。波長分配方案I={σ1(o，w)，…，σ|O|(o，w)}中的σ(o，w)相互獨立。

(2) 合并階段。聯盟基于所選擇的序列對I進行遍歷，若其滿足條件式(5)，則進行合并操作。

(3) 分裂階段。若滿足條件式(6)，則對該聯盟進行分裂操作。

(4) 直到聯盟結構中的所有聯盟沒有合并與分裂活動為止，輸出V-CRAN的劃分。

(5) 在每個V-CRAN即服務提供商中，根據式(9)計算用戶的視頻中斷危險程度參數。

(6) 服務提供商在每一個時刻t根據式(23)和式(24)的邊際效用調整價格策略。

(7) 用戶在得知服務提供商的價格策略后，根據式(19)更新自己的無線資源需求策略，直到所有用戶的效用達到均衡為止。

(8) 如果服務提供商的效用達到了均衡，則停止迭代；否則，在下一個t+1時刻，服務提供商根據用戶的無線資源需求調整價格策略，不斷重復(6)過程。

(9) 直到達到均衡，輸出無線資源分配策略。

4 仿真結果及分析

4.1 仿真參數設計

采用Python仿真平臺對體驗質量感知的虛擬化云無線接入網視頻傳輸資源分配策略QAVTRAS進行驗證，與基于用戶播放緩沖區感知(Buffer-Aware Resource Allocation algorithm，BARA)的算法[26]、基于速率(Rate-Based Algorithm，RBA)的算法[27]、INLP多目標優化以及不考慮調諧開銷(QAVTRAS With No Wavelength Tuning，QAVTRAS-WNWT)、負載均衡(QAVTRAS With No Load Balance，QAVTRAS-WNLB)和用戶緩沖區大小(QAVTRAS With No Considering Buffer，QAVTRAS-WNCB)算法進行對比。其中，BARA算法是根據用戶播放緩沖區的大小改變視頻比特率以適應無線信道的變化。RBA算法根據信道狀況的好壞選擇最高可用的視頻比特率版本。為了不失一般性，假設C-RAN網絡中小區的數量為32個，TWDM-PON作為前傳的波長數目為8個。通過數值仿真的方式從網絡負載的均衡程度、前傳帶寬分配效率、用戶播放中斷次數以及用戶的效用驗證所提策略的有效性。網絡的系統參數如表1所示。

表1 仿真參數設置

此外，視頻的比特率版本設置為{100 kbit/s，200 kbit/s，300 kbit/s，500 kbit/s，700 kbit/s，900 kbit/s，1 100 kbit/s，1 300 kbit/s}，其中每個視頻片段的長度設置為2 s。

4.2 仿真結果分析

圖2描述了C-RAN中前傳帶寬分配效率隨網絡中用戶數目的變化曲線。由圖可知，隨著用戶數目的增加，筆者提出的QAVTRAS和QAVTRAS-WNWT算法均呈上升趨勢，并且QAVTRAS-WNWT算法相比于INLP多目標優化算法的前傳帶寬效率更高。這是因為QAVTRAS算法能夠根據用戶請求的視頻質量和所期望的無線資源數量合理地劃分V-CRAN。而QAVTRAS算法的帶寬分配效率略低于QAVTRAS-WNWT，這是因為考慮到不同光網絡單元的調諧范圍，在分配波長資源時受到波長調諧的限制，故而形成的V-CRAN的前傳帶寬分配效率低于QAVTRAS-WNWT。在考慮波長調諧開銷和不考慮波長調諧開銷的情況下，隨著用戶數目的增加，QAVTRAS算法構建的前傳帶寬分配效率最大可分別提升25%和33%。

圖2 不同用戶數量下的前傳帶寬分配效率

圖3描述了負載均衡性隨不同負載率變化的曲線。在未優化的C-RAN網絡場景中，QAVTRAS-WNLB將波長資源固定的分配給不同的小區，并不考慮波長之間的負載情況，從而導致在高負載情況下不同波長承載的業務量差異性較大，使得前傳網絡中負載波動大。而采用QAVTRAS和QAVTRAS-WNWT算法場景中的負載波動遠低于QAVTRAS-WNLB。這是因為這兩種算法在優化過程中，根據用戶請求的視頻質量和無線帶寬數量動態地劃分V-CRAN，盡可能地讓每個波長達到均衡，從而使得均衡性在高負載時，隨負載率增加而呈下降的趨勢，并且QAVTRAS算法逐漸向INLP靠近。

圖3 不同負載下光前傳網絡的負載均衡狀態

圖4描述了在100 s內用戶的中斷次數隨負載率變化的情況。由圖可以看到，用戶的中斷次數隨著網絡的負載率增加逐漸上升。顯然，當負載率增加時，網絡中傳輸的數據增多，從而導致用戶的中斷次數隨著網絡的負載率增加而上升。當網絡處于低負載率狀態時，不同算法用戶的中斷次數差距不明顯，這是因為網絡中傳輸的數據量不大，4種算法都能快速地進行數據傳輸。然而當負載率增加時，QAVTRAS和BARA算法的中斷次數小于其他算法的。這是因為所提算法根據用戶請求的視頻質量和播放緩沖區大小確定用戶的視頻中斷危險程度，能在一定程度上減少視頻中斷的次數；并且在劃分V-CRAN的過程中，考慮了波長之間的調諧時間開銷，減少了視頻傳輸過程中的時間成本。BARA算法是基于用戶的播放緩沖區大小來選擇視頻比特率傳輸的，當用戶的播放緩沖區的長度大于或小于閾值時，選擇相應最高/最低的視頻比特率版本進行分發，因此減少了視頻中斷的次數。然而，QAVTRAS-WNCB算法沒有考慮用戶實際播放緩沖區的長度，因此無法保證分配給用戶無線資源的數量，導致視頻中斷次數過多。RBA算法隨著負載率的升高，中斷次數逐漸增加，這是因為低負載率時網絡中有較多的資源能夠傳輸高比特的視頻版本；但當負載率逐漸升高時，網絡中的資源減少使得視頻下載的時間增加，因此用戶的中斷次數增多。

圖4 不同負載率下用戶的平均中斷次數

圖5描述了在迭代過程中不同用戶的效用函數(即具有不同視頻中斷危險程度a值的大小)隨迭代次數變化的曲線。不同用戶觀看視頻時的播放緩沖區大小不一樣，根據式(9)計算用戶視頻中斷危險程度的a值。由圖6可知，用戶1的效用大于用戶2的效用。由式(19)可知，視頻中斷危險程度a值越大，分配給用戶的無線資源也就越多，因此能夠保證用戶的視頻質量，故而帶給用戶的效用也就越大。而用戶的效用在迭代開始的時候比較大，是因為服務提供商的價格設定的比較低；隨著迭代次數的增加，服務提供商不斷地調整價格策略。在迭代的過程中，用戶也不斷調整自己的無線資源需求策略，因此用戶的效用呈下降到上升再到穩定的趨勢。在迭代次數大約200次時，用戶間達到納什均衡。

圖5 不同用戶的效用在迭代過程中的變化

圖6 用戶和服務提供商間的納什均衡

圖6描述了V-CRAN的Stackelberg博弈的納什均衡。在兩階段的博弈中，第1階段，服務提供商給出自己的價格策略，用戶根據其價格策略響應自己的帶寬需求。由于服務提供商為了獲取更多的收益，不斷地提高價格，使得用戶的無線資源需求降低，同時服務提供商的效用降低。第2階段，服務提供商根據用戶的資源需求策略調整價格，價格不斷降低，用戶的無線資源需求量增加，服務提供商的效用增加。經過多次博弈后，大約在迭代200次時，服務提供商的價格策略和用戶的無線資源需求達到穩定，說明了該算法的有效性。

5 結束語

為解決云無線接入網絡傳輸中光域和無線域資源分配不平衡、用戶體驗質量差的問題，在基于軟件定義網絡的TWDM-PON前傳的C-RAN架構下，筆者提出了一種體驗質量感知的V-CRAN視頻傳輸資源分配策略。為了保證用戶的體驗質量，在光域提出了一種基于聯盟博弈的V-CRAN波長資源分配算法，實現光域和無線域資源的聯合分配。在無線域，將用戶緩沖區大小、請求的視頻質量作為衡量視頻體驗質量的主要指標，建立用戶和服務提供商(即V-CRAN)兩階段的Stackelberg博弈，進一步優化了無線資源的分配，從而減少了視頻播放的中斷次數。仿真結果表明，所提方案能夠保證用戶體驗質量的同時，合理分配光域和無線域資源，提高了資源的利用率。