李 敏, 許振飛, 許崇志, 年安君
(國網蚌埠供電公司 信通公司, 蚌埠 233000)
隨著智能電網研究和應用的快速發展, 電力通信網在電力行業中的作用越來越重要. 當前, 電力通信網主要由底層物理網絡、上層業務邏輯網絡構成[1]. 其中, 底層物理網絡主要由光纖通信網構成, 并輔以微波、衛星等傳輸方式. 上層業務邏輯網絡主要由路由器、交換機等數字通信網絡構成, 完成電力調度及業務的實時控制. 電力通信邏輯網絡承載的業務主要包括配網保護、配電網視頻監控、配網運行狀態檢測、用電信息采集自動化等電力通信業務, 各類業務對網絡延遲、帶寬、網絡可靠性等要求不同[2].
上層業務邏輯網絡的穩定運營, 對于電力業務的穩定運行起著非常關鍵的作用. 但是, 當前電力系統自有的底層物理網絡的光纖覆蓋水平較低, 還存在光纖芯數緊張, 資源不足的情況, 還有較多地區的底層物理網絡采用租用第三方光纖實現電力通信的問題. 為解決這些問題, 已有部分研究提出一些解決方法[3–5]. 文獻[3,4]研究均衡電力通信網絡的經濟性、可靠性和業務分布, 以最小的代價建設最可靠的電力通信網. 文獻[5]制定了不同優先級的 QoS 差異化策略. 但是, 這幾種 QoS 保障機制只適用于傳統網絡. 網絡虛擬化技術是當前網絡轉型的關鍵技術, 在 QoS 保障方面具有較大優勢[6–10]. 網絡虛擬化環境下, 電力通信網包括基礎設施提供商 (Infrastructure Providers, InPs)和服務提供商 (Service Providers, SPs). 其中 InPs 創造和管理基礎網絡, 包含計算節點、鏈路資源等物理資源. 而 SPs 根據電力通信業務的需求, 為業務提供差異性服務. 文獻[11]通過提高休眠節點和鏈路數量, 提高底層網絡資源的利用率. 文獻[12]采用隱馬爾科夫模型描述滿足資源約束的可用的底層網絡節點拓撲信息. 文獻[13]建立了高效節能節點映射運輸模型. 文獻[14]用概率理論輔助分析了每個虛擬節點的多個可用物理節點被選中的概率. 上述的虛擬化資源分配主要解決提高底層節點或鏈路資源利用率的問題, 缺少對多個服務提供商和多個基礎設施提供商環境下電力通信網絡的帶寬容量、資源成本、資源價格等QoS要素的綜合考慮, 不能很好的解決電力通信網在QoS驅動的資源分配時面臨的問題.
為了有效地保證智能電網中業務的隔離性和解決智能電網資源高效分配問題, 該文借助網絡虛擬化技術, 首先對QoS驅動的SP資源分配問題進行了形式化的描述, 提出了基于三方博弈的兩階段資源分配模型. 該模型通過引入一類“資源分配中心”實體, 將資源分配問題轉化為由資源提供者、資源請求者、資源分配中心三方組成的博弈過程. 基于這個資源分配模型,提出一種QoS驅動的電力通信網效用最大化的資源分配機制. 通過對提出的資源分配機制的分配策略性能分析, 證明了本文提出的資源分配機制滿足占優策略激勵兼容特性, 并且可以實現系統利潤最大化的目標.最后, 通過仿真實驗, 驗證了本文的資源分配機制的有效性.


根據QoS驅動的資源分配問題的形式化描述, 本小節首先提出了基于三方博弈的兩階段資源分配模型.其次, 基于這個資源分配模型, QoS驅動的資源分配機制被提出. 最后, 通過對提出的資源分配機制的分配策略性能分析, 證明了本文提出的資源分配機制的有效性.
由于拍賣機制可操作性強, 可使資源在短時間內被合理分配, 獲得系統范圍內最優解或較優解[15–17]. 拍賣機制已被成功應用到網絡資源分配[18–20].本文提出的基于三方博弈的兩階段資源分配模型如圖1所示, 該模型通過引入一類“資源分配中心”實體, 將電力通信網的資源分配問題轉化為由資源提供者、資源請求者、資源分配中心三方組成的博弈過程. 模型主要包括InP Agent模塊、SP Agent模塊、資源分配中心Agent模塊.

圖1 基于三方博弈的兩階段資源分配模型
資源分配時, 在第一階段, InP Agent向資源分配中心上報資源供給信息, SP Agent向資源分配中心提出資源需求信息. 在第二階段, 資源分配中心使用資源分配機制, 執行資源分配, 并向 SP Agent返回資源需求的支付信息, 向InP Agent返回資源供給的效用信息.
InP的效用為銷售計算資源和帶寬資源帶來的收益. 如果InP能夠被激勵上報自己資源的真實情況, 資源分配中心才能夠求解出真實的資源分配情況, 否則,會出現資源分配錯誤. 例如, 假設InP的計算資源容量為150個, 但是InP出于自私的目的, 誤報自己的計算資源容量為200個, 當資源分配中心為其分配180個計算資源請求時, 由于InP不能提供SP 120個計算資源, 導致資源分配失敗, 影響資源分配中心和InP的市場信譽. 為了使InP能夠被激勵上報自己資源的真實情況, 本文定義QoS驅動的InP的效用函數為:



為了防止InP說謊, 導致資源分配失敗, 影響資源分配中心和InP的市場信譽. 本文對故意誤報資源供給信息的InP進行懲罰:

基于資源分配模型和InP效用函數的定義, 本文提出的QoS驅動的資源分配機制如下:
1) n個InP Agent向資源分配中心上報資源供給信息
2) m個SP Agent向資源分配中心提出資源需求信息
3) 資源分配中心使用公式(2), 為每個SP需求分配資源, 得到分配向量
5) 資源分配中心使用式(6)計算InP的效用值, 結算后完成本次交易.
在該機制中, “資源分配中心檢測InP是否能夠確保其上SP業務按QoS要求運行”是基于SP向資源分配中心的反饋獲得, 所以, 說謊話只有當InP虛報的容量不能滿足給他分配的資源請求時, 資源分配中心才會發現, 并對其進行懲罰. 在后續研究中, 可以對此機制進行優化, 提高SP業務的QoS.
有效的拍賣機制是指每個參與者都可以得到占優策略. 由文獻[16]可知, 要實現占優策略, 參與者需要實現激勵相容性、資源分配效率兩個目標. 其中, 激勵相容性是指投標者出于自利的目的, 而投標自己的真實成本函數, 需要證明投標真實估價是所有投標者的占優策略(使用定理1證明)、參與者是個體理性的并且都會積極的參與到拍賣中來(使用定理2證明). 資源分配效率是指實現系統利潤的最大化, 可以使用定理3證明.
定理1. 對于每一個交易者的拍賣價格和數量是策略性防偽的(Strategy-Proof).
證明:

因為


上式變為:

由于第一部分會影響全局的最優資源分配結果,所以, 資源分配中心會限制單個InP對其固定成本和單位價格的誤報. 如發現誤報的InP擾亂市場價格機制, 會將其從交易市場中剔除. 所以, 對于固定成本和單位價格來說, 真實的取值是占優策略.

所以, 每個InP報真實的容量是最優策略.
綜上所述, 對于每個InP, 真實的上報自己的固定成本、單位成本以及容量的策略, 是每個交易者的占優策略.
證畢.
定理2. 每個參與者是個人理性的(Individual Rational).
證明:
要證明每個參與者是個人理性的, 需要證明參與者的效用函數一直取非負值. 因為每個InP上報自己真實的情況, 所以, 效用函數為:

又因為

的參與者的個數比

證畢.
定理3. 證明機制的分配效率是較高的.
證明:
首先, 式(2)的優化目標是實現系統利潤最大化,能夠產生比傳統資源分配策略更大的交易量, 從而提高了網絡資源利用率. 其次, InP真實的上報自己的價格, 這樣SP會按照用戶的需求, 真實的向InP申請資源. 如果InP提高自己的價格, SP必將提高服務價格,從而導致用戶的使用需求降低, 導致市場處于資源過剩狀態. 所以, 本文提出的資源分配機制, 有助于提高InP資源的使用效率. 因此本文的資源分配機制的分配效率較高.
證畢.
本文使用Matlab環境進行仿真. 仿真中包括10個InP作為資源供給者, 10個SP作為資源需求者.InP的固定啟動成本都服從均勻分布(25,50), 資源單位成本都服從均勻分布(1.5,2.5), 資源的最大供給量都服從均勻分布(25, 50). 設定SP請求的計算資源容量與鏈路資源容量數量相同, SP的資源需求量從初始600, 步長50遞增,直到賣者的總供給量, 隨機分布到所有的買者當中.
1) InP 的總效用
InP的總效用定義為N個InP的效用值之和.

2) InP的資源平均利用率
InP的資源平均利用率定義為被使用的InP資源數量除以總的InP資源數量.

QoS驅動的資源分配機制的有效性, 通過驗證InP Agent在說謊和說實話兩種環境下, InP市場總效用的變化情況. 從10個InP中隨機選擇h個InP夸大自己的資源容量 t個, 實現 InP說謊. 其中
1) 說謊和說實話兩種環境下InP的總效用比較
說謊和說實話兩種環境下InP的總效用比較如圖2所示. 圖中X軸表示資源需求量遞增, 從600開始;Y軸表示InP獲得的總效用值. 從圖2可知, 在總需求量變化時, 當InP說謊, InP的總效用值都低于InP上報真實容量時的總效用值. 所以, 在多個網絡環境下,本文提出的機制都能保證說真話得到更多的InP的總效用. 但是, 在個別環境下, 說謊話還是能得到較大的InP的總效用. 由于說謊話只有當InP虛報的容量不能滿足給他分配的資源請求時, 資源分配中心會對其進行懲罰.

圖2 說謊和說實話兩種環境下InP的總效用比較
2) 說謊和說實話兩種環境下InP的平均利用率
說謊和說實話兩種環境下InP的平均利用率比較如圖3所示. 圖中X軸表示資源需求量遞增, 從600開始; Y 軸表示 InP 的平均利用率. 從圖3可知, 在總需求量變化時, 當InP說謊時, InP的平均利用率都低于InP上報真實容量時的平均利用率. 所以, 在多個網絡環境下, 本文提出的機制都能保證說真話得到更多的InP的平均利用率. 由于本文提出的機制提高了InP的資源利用率, 所以, 本文的機制可以保證SP得到較好的容量保證.

圖3 說謊和說實話兩種環境下InP資源平均利用率比較
隨著智能電網的快速發展, 電力通信業務需要的帶寬容量、資源成本、資源價格等QoS要素在資源分配中越來越重要, 僅考慮提高電力通信網絡資源利用率的研究已經不能解決這個問題. 為了有效地保證智能電網中業務的隔離性和解決智能電網資源高效分配問題, 該文借助網絡虛擬化技術, 首先對QoS驅動的SP資源分配問題進行了形式化的描述, 提出了基于三方博弈的兩階段資源分配模型. 該模型通過引入一類“資源分配中心”實體, 將資源分配問題轉化為由資源提供者、資源請求者、資源分配中心三方組成的博弈過程. 基于這個資源分配模型, 提出一種QoS驅動的電力通信網效用最大化的資源分配機制. 對于拍賣者及其獲勝者確定占優策略問題, 證明了參與者集合能夠實現激勵相容和系統利潤最大化兩個目標. 最后, 通過仿真實驗, 驗證了本文資源分配機制的有效性.