李小焱
(國網山東省電力公司 濟寧供電公司, 山東 濟寧 272000)
智能電網(SG)系統中智能設備生成具有多個異構屬性的高維數據,并且其值隨時間而變化[1]。數據的高維會影響大多數設計方案的性能,在對大數據進行有效存儲之后,主要任務是通過底層SG網絡高效地傳輸降維后的數據[2]。文獻[3]重點介紹了智能電表生成數據類型和處理數據所需的技術。由于從各種智能設備定期生成的數據導致網絡通信流量擁堵,因此,網絡級的數據處理已成為SG系統面臨的主要挑戰[4]。文獻[5]提出了在智能電表和電網之間,利用高級電表架構(AMI)蜂窩網絡進行實時數據傳輸。因此,軟件定義網絡(SDN)作為高效的數據流量平臺在SG系統中,可以在現有的網絡基礎設施上進行高效的數據流處理。文獻[6]提出了一種基于SDN的微電網通信體系結構,以便為終端用戶提供靈活可靠的服務。文獻[7]利用SDN為SG系統設計了自主管理的變電站網絡。SDN可減少延遲和提高吞吐量的形式提高傳輸性能,從而有利于大數據應用[8]。
針對SG系統中不同智能設備獲取數據后的降維數據,本文設計了一種基于SDN的智能電網降維數據傳輸方案,設計了一種基于經驗概率的控制算法(EPCS),用于計算在SG網絡上轉發降維數據的最佳路徑。
為了更好地說明本文所利用的SDN模型優勢,將SDN模型與蜂窩網絡模型進行對比示例,如圖1所示。
如果通過傳統網絡信道傳輸20 Mbits的數據幀,則以20 Mbps的數據速率到達目標節點需要1秒,如圖1(a)所示。如果數據量被降維到16 Mbits,可以省略所有無用和不需要的值,則以相同的數據速率到達目標節點僅需0.8秒,如圖1(b)所示。因此,數據量對傳輸時間有很大的影響。由于在SG系統中有大量的數據是無縫傳輸,因此,如果這些數據被減少,則有利于網絡傳輸的整體性能。

(b) 路由方案得到的吞吐量圖4 方案的評價結果

(a) 降維率與誤差率之間的統計權衡

(b) 通過蜂窩網絡傳輸的降維數據用時

(a) 通過蜂窩網絡傳輸的原始數據用時
當網絡遵循動態網絡管理方案時,可以幫助實現更好的網絡資源利用率,從而實現更高的吞吐量。例如,如果在蜂窩網絡上傳輸降維的數據幀,則可以使用傳統網絡協議選擇最短路徑。在這種情況下,實現50 Mbps的數據速率以及25%的鏈路利用率和12.5 Mbps的吞吐量,如圖1(c)所示。如果部署了諸如SDN之類的動態網絡,則實現55 Mbps的數據速率以及25.2%的較好鏈路利用率和13.7 Mbps的增強吞吐量,如圖1(d)所示。因此,通過在SG系統中部署SDN的網絡基礎設施用于數據管理,可以實現更好的吞吐量、數據速率和鏈路利用率。鏈路的更好利用還有助于減少網絡基礎架構的能耗。

(c) 通過傳統網絡傳輸的降維數據

(d) 通過SDN網絡傳輸的降維數據
本文提出一種以SDN作為SG降維數據傳輸的智能方案,以此對SG系統進行動態網絡管理。SDN作為開放且可編程的平臺,通過其良好的解耦平面可以實現智能且動態的網絡控制。SDN從網絡應用程序中抽象出底層基礎設施,使得網絡配置中的動態變化管理和重新配置變得容易[9]。利用SDN的可擴展性和高效性,可以有效地處理SG系統中不斷生成的大數據流量。因此,將大數據降維技術與SDN相結合,可以為終端用戶提供可擴展、高效的服務。本文使用3個平面設計了SDN網絡模型:(1)數據平面;(2)控制平面;(3)應用平面,如圖2所示。

圖2 SDN網絡模型三個平面設計
在該模型中,數據平面主要由交換機、轉發設備和路由器等網絡設備組成,數據從SG系統中的各種設備獲取,如工業用電、家庭用電和商業用電。該平面使用OpenFlow協議(OFP)作為通信標準,將收集到的數據轉發到上層平面[10]。在位于控制平面的服務器上,將采集到的數據降維處理,并結合控制算法對核心數據進行高效傳輸。因此,本文設計了一種基于經驗概率的控制算法(EPCS)來估計SG網絡上數據傳輸的最優路徑。最后,應用平面為不同的用戶和SG提供各種服務。
數據平面由轉發節點(FN)組成,如OpenFlow交換機、路由器和網關。在控制平面上,SDN控制器負責為FN做出轉發決策。通過南向接口將這些決策配置為FN,結合位于FN的通道相互連接流量表和分組表。
由控制器提供的指令集遵循的流量表由不同的字段組成,例如,接口ID、指令、優先級、操作、端口號等。SDN模型的流量匹配過程如圖3所示。

圖3 SDN模型中的流量匹配過程
控制器交換通信的主要步驟如下。
步驟1:解析系統分析輸入的數據包,以此確定如何對其進行處理,主要分為3個步驟:(1)標頭識別,(2)字段提取,(3)字段緩沖。在分析數據包之后,輸出數據將傳輸到查找標頭。
步驟2:接收到輸出數據后,查找功能從入口端口啟動,并在出口端口結束。通常,使用兩種查找方法:(1)精確匹配,(2)通配符匹配。精確匹配使用hash函數設置特定項的精確位置。通配符匹配是用于多表查找的復雜部分字符串匹配,旨在匹配條目的標頭字段。
步驟3:當OpenFlow交換機接收到數據包后,匹配系統就會啟動路由決策任務。如果在表中找到合適的匹配項,則執行相應的操作。在這種情況下,數據包將轉發到相關端口,并且OpenFlow交換機更新其第一計數器,即匹配計數器。相反,如果匹配失敗,則將數據包發送回控制器。在這種情況下,OpenFlow交換機更新其第二計數器,即不匹配計數器,控制器重構一個新的流量規則并將其插入到OpenFlow交換機。流量驅動規則緩存算法(FDRCA)[11]用于替換流量表中的條目,FDRCA是基于策略的算法,可通過特殊的替換策略來處理有限的緩存限制和不可預測的流量。
步驟4:使用流量表通道連接所有表(表1到表n),還可以使用分組表。
步驟5:使用計數器記錄發送到控制器的數據包數量。
步驟6:成功匹配數據包標頭字段后,在操作集將輸出數據包定向到出口交換機端口。
每個OpenFlow交換機上維護的流量表條目,如表1所示。

表1 OpenFlow交換機的流量表條目
流量表條目(例如源ip、目標ip、優先級、端口號入口端口和操作)對于在不同實體之間進行數據傳輸的決策非常重要。但是,這可能會根據輸入流的情況和要求動態變化。表1中各種流量表條目的具體說明如下。
(1) 表號:流量表的編號,即它在流量表管道中的相對位置。
(2) 條目ID:為OpenFlow交換機的流量表中的每個條目分配一個唯一的ID(主key)。
(3) 優先級:流量表中每個條目的重要性。
(4) 入口端口:傳入數據包到達的物理端口及虛擬端口。
(5) VLAN id:包含13位虛擬LAN id和3位VLAN類型。
(6) IPv4地址(IPv4 dst):由32位IPv4地址組成。
(7) TCP地址(TCP dst):包含16位TCP源端口和目標端口地址。
(8) 操作:數據包與相關規則匹配后要遵循的說明。
(9) 計數器:分配給各種屬性,如字節計數器、數據包計數器、標志、流量持續時間和丟棄的數據包數量。
在該算法中,所有的FN都可以表示為SDN-FN和非SDN-FN。通過至少一個SDN-FN的數據屬于可控流,而不通過任何SDN-FN的數據視為不可控流[14]。對于網絡Z(N,L),有N個節點和L個鏈路,c(l)表示信道容量;f(l)表示鏈路L上的流量。本文將流量表條目更新為新的流量表條目(Nr),將舊的流量表條目作為觀測集,并將其反饋給SDN控制器的估計器,以此進一步預測或估計最優路徑(Np)。

(1)
其中,np表示轉發給控制器的新數據包;op表示流量表中的舊觀測值。

(2)
(3)
基于經驗概率的控制算法(EPCS),如下所示。


THRcrlb的值是使用CramrRao下限(CRLB)方法計算得出[15]。文獻[15]指出,任何無偏估計量的方差至少與Fisher信息的逆(I(θ))一樣。如果估計器達到CRLB,則其有效。使用CRLB進行MSE的條件如式(4)。
(4)
其中,I(θ)表示如式(5)。
(5)
本文利用單個家庭用電量的數據集,對所提出的基于EPCS的SG設備降維數據傳輸SDN模型進行評估。該數據集以每分鐘的采樣率收集了大約4年(2015年12月至2019年11月),共2 075 259個測量值,數據集包含一些缺失值以及各種次級計量值和電量值。利用R編程和MATLAB將仿真結果進行比較,為了評估SDN在傳輸SG降維數據方面的性能,在Mininet網絡仿真器中設計了一個網絡拓撲。
本文利用以下評價參數對所提出的方案進行了評估。

(6)
(2) 統計權衡:降維前后數據誤差率(ρ)和降維率(λ)之間的權衡,并且彼此成反比,如式(7)。
(7)
(3) 傳輸延遲(d):特定路由器上的延遲,包括處理延遲(dpr)、排隊延遲(dq)、傳輸延遲(dt)和傳播延遲(dpg),如式(8)。
d=dpr+dq+dt+dpg
(8)
(4) 吞吐量:指通過通信信道成功傳遞消息的速率,也可以稱為數據處理的最大速率。
將采集到的SG數據進行降維處理,利用本文所提出的SDN模型對降維后的數據進行傳輸,實驗結果如圖4所示。
圖4(a)表明,降維后的數據誤差率較低,保留較高的核心數據信息,因此,可以達到最小化誤差率的總體目標,并且滿足后期SDN傳輸的要求。當從各種SG設備獲取的數據保留為核心數據時,則使用SDN基礎設施在SG網絡上進行處理和傳輸。為此,本文設計EPSC算法來估計簡化數據的最優路徑。在對所提出的方案進行評估后,所有性能指標都顯示出適當的增長。圖4(b)表明,采用EPCS算法可以得到更高的吞吐量。基于EPCS路由估計器的評價結果如圖5所示。
圖5(a)給出了使用所提出基于EPCS路由估計器和SDN在SG網絡上傳輸簡化數據時所產生的延遲,與標準的SDN路由方案(不利用EPCS的OpenFlow算法)相比,將數據傳輸到目標節點所引起的延遲更小。圖5(b)給出了得到的估計精度,結果表明,最優路徑估計精度明顯優于標準的OpenFlow算法。在增加丟包率的情況下,其準確度下降較小。圖5(c)給出了使用所提出基于EPCS路由估計器的帶寬使用情況。控制方案在SG網絡上傳輸降維數據時,可用帶寬得到了最佳利用。利用EPSC估計路線的RMSE值,如表2所示。

(a) 傳輸延遲

(b) 估計精度

(c) 帶寬使用情況圖5 基于EPCS路由估計器的評價結果

表2 EPCS的RMSE值
上述討論的評估結果描述了該方案在各種性能指標下的有效性和效率。
針對SG設備產生的海量數據,本文利用SDN模型為基礎,提出了基于EPCS的SDN控制方案用于計算數據降維后的轉發路徑。結果表明,所估計的路徑具有較低的傳輸延遲和較高吞吐量的特點,并且保持了較高的路由估計精度。最后,帶寬利用率保持穩定,避免了任何擁塞或帶寬利用率不足。