潘志新,翟學鋒,王成亮,官國飛,徐妍
(江蘇方天電力技術有限公司,江蘇 南京 211100)
配電網作為連接變電站與用戶的重要公共基礎設施,是提升智能電網末端供電質量和用戶體驗的關鍵環節[1-2]。伴隨著我國配電網智能化發展,除傳統配電網本身運行和管理數據之外,智能化的感知終端設備產生的數據大量增加,且呈現種類繁多、多源、不確定等特性[3]。
傳統應用配電網中心采用云-邊緣的計算模式,由于海量數據的急劇增加和數據復雜度的影響,產生的上行終端監測數據和配電網運行數據以及下行云計算處理信息為通信傳輸層帶來了巨大壓力,同時嚴重約束了智能配電網的推進。深入挖掘邊緣計算在配電網智能化中的應用潛力成為了主要研究熱點,越來越多的配電網數據信息終端化處理、邊緣化計算及局部化解決的方式成為一種重要方式[4-5]。但是復雜的多源異構數據的邊緣化集成為智能配電網的高效邊緣計算帶來新的挑戰,因此,亟待實現智能配電網多源數據邊緣化模式下的處理和融合,是提升和保證基于邊緣計算的配電網智能化發展的重要基礎[6-7]。
長期以來,國內外專家學者關于智能配電網海量數據分析挖掘方法與多源數據處理與融合技術開展了眾多有意義的研究,周楊珺等[8]針對配電網數據源及數據特征展開分析,并設計了包含四個層次的配電網運行數據分析系統架構;孫浩洋等[9]提出了一種邊緣計算技術在配電網物聯網中的應用方法,并深入分析了邊緣計算技術在配電行業的實際應用中面臨的不足之處;Okay F Y等[10]提出了一種邊緣計算架構在智能電網模型中的應用方法,并結合智能終端數據與運行量測數據,具體闡述了邊緣計算在數據安全與效率分析方面的意義;馬洲俊等[11]提出了多源異構數據分析結果輔助配電網故障信息識別定位的策略,為有效挖掘配電網智能化數據應用化價值提供了研究借鑒;Barik Rabindra K等[12]提出了利用先進的計量基礎設施和霧計算融合實現智能電網增強,延伸了分布式控制、通信和計算的能力,使得智能電網的可靠性、彈性和可伸縮性均得到了提高;王維嘉等[13]建立了一種自適應多目標群交叉優化算法實現多源數據分類融合與異構數據的準確融合。
綜上所述,智能配電網的發展已然成為一種必然趨勢,邊緣計算技術的應用提供了分布式服務和計算的功能,但海量多源異構配用電數據的有效清洗與聯接研究的不足,使得邊緣計算性能的巨大潛力無法發揮。文中提出一種基于邊緣計算的智能配電網多源數據處理與融合技術,設計充分考慮邊緣計算的數據處理與融合架構;提出基于廣義冪變換Zscore(Box-Cox transformation Zscore,BC-Zscore)的各配電網數據源量綱和數量級的變換統一處理方法;通過構建基于沖突優化DS推理(principal components analysis-dempster shafer,PCA-DS)的多源數據融合模型,基于多維特征因素考量對多源異構數據進行分組聚合。考慮邊緣計算的智能配電網多源數據的處理與融合技術研究,可有效實現配電運行數據、終端監測數據、環境信息數據等基礎數據源的融合,為提升智能配用電大數據多源并行挖掘和融合計算分析奠定了良好的基礎,具有重要的研究價值和意義。
智能配電網(smart distribution grid,SDG)建設,是指通過引入現代電子、通信、網絡、計算機等領域的前沿技術,實現整個配電系統配電過程穩定和異常運行情況下的監視、保護與控制[14]。
結合邊緣計算定義和技術特點,可有效解決智能配電網建設過程中的核心環節,作用于末端電力運行設備及智能監測設備與云主站之間,實現數據匯聚的基礎、數據計算、數據存儲以及更高級別的數據應用,充分發揮本地計算的邊緣化結構優勢,達到智能配電網終端擴展、拓撲靈活、計控實時的配電業務功能目標[15-16]。而目標的實現或實現程度則取決于配用電大數據下的數據匯聚操作,配用電數據的匯聚不單單是對數據的匯總與整合,應是配電管理系統中多源異構信息數據量綱和量級的處理變換,以及充分考慮不同數據源間特征屬性關聯的深度融合。高效的多源數據處理與融合可以促使配用電數據更好地服務于邊緣計算,提高邊緣計算在智能配電網中的應用能力。
考慮邊緣計算下的智能配電網多源數據處理與融合架構如圖1所示。

圖1 多源數據處理與融合架構Fig.1 Multi-source data processing and fusion architecture
配電網運行過程中各數據源特征屬性的格式、量綱、數據類型以及數量級均不相同,為實現智能配電網邊緣化的數據融合計算和信息挖掘,必須消除多種不一致因素產生的限制,實現對多源數據的標準化處理。根據配電大數據時序性的特征,通過在原有Zscore多源異構數據標準化處理基礎上引入Box-Cox轉換,文中提出一種基于廣義冪變換Zscore的配電網多源異構數據標準化處理方法。
由于Zscore數據標準化處理是假設多源異構數據因子服從正態分布規律的,否則時序數據的偏度和峰度的影響會使得數據處理過程中某一因子上的得分明顯偏大或偏小,Box-Cox轉換作為一種廣義冪變換方法,可有效地處理連續響應變量不滿足正態分布的情況,在一定程度上消除配用電數據運行或采集過程中產生的多源時序數據波動偏移問題,保證了多源異構數據標準化處理的準確性和穩定性。
多源數據標準化處理流程如圖2所示。

圖2 多源數據標準化處理流程Fig.2 Multi-source data standardization process
具體方法執行步驟如下:
步驟1:將采集的智能配電網多源數據根據時序特征進行分解處理,記X為標準化變換輸入,其中X能夠以多維數據的形式、矩陣形式及向量形式存在。設當X=(X1,X2,…,Xp)以矩陣形式出現時:

步驟2:由于配用電大數據多源異構的特點,為保證不同源數據格式均實現數據變換處理,分別設置應對不同格式的BC-Zscore標準化變換方案:
1)若X是以向量的形式存在時,返回變換后的結果向量
2)若X是以矩陣的形式存在時,逐一利用X的列向量的均值和標準差對相應的列進行數據標準化處理,返回變換后的結果矩陣BC_Z;
3)若X是以多維數組的形式存在時,通過沿X的多個維度求解其均值和標準差,再對X進行數據標準化處理,返回變換后的高維數組BC_Z。
步驟3:X=(X1,X2,…,Xp)經BC-Zscore數據標準化處理后:

其中

Xj的標準差;i=1,2,…,n;j=1,2,…,p。
經過BC-Zscore數據變換處理后X=(X1,X2,…,Xp)的每列中
步驟4:根據選定的多源數據處理方案進行數據迭代處理,循環執行步驟2步驟3,匯聚數據變換處理結果。
步驟5:直到任務輸入的數據源均經過量綱與量級的統一變換后,進行任務輸出保存,用于多源數據融合、邊緣數據計算或數據存儲,多源數據標準化變換結束。
基于邊緣計算模式下的智能配電網主要包括三個階段:信息融合、狀態評估以及關聯決策。信息融合通過對配用電大數據處理與融合實現,只需要涉及極少簡要的數據計算,關鍵數據計算處于信息融合后的階段之中[17-18]。因此,數據融合的性能和意義顯得極為重要,直接關系到配電網狀態評估和關聯決策計算結果值。文中在多源數據標準化處理的基礎上,構建基于沖突優化DS推理的配電網多源數據融合模型,經過數據融合將來自多個數據源或來自相關數據庫的異構數據結合在一起,從而相比使用單一數據源的邊緣計算獲得更高的準確性。
D-S(Dempster-Shafer)推理法,以下簡稱 DS推理法,作為一種處理不確定性問題的經典數據融合方法,實現了對概率論中貝葉斯條件概率的進一步改進,避免了先驗概率的計算,能夠很好地表示“不確定”,被廣泛應用于各種領域的數據融合[19]。但由于DS推理法處理沖突子集時,因組合規則中的歸一化過程會出現違背不同數據源融合常理的結果,因此,應用PCA算法對DS推理法在處理沖突數據源融合時進行進一步優化PCA可以實現尋找m(m<n)個新成分的目標,使它們反映沖突信息的主要特征,實現沖突信息主要成分的提取利用,而不是全部分配給未知項不進行融合考慮,可利用的成分取決于所定義的成分可信度函數:

基于PCA-DS推理的多源數據融合模型具體流程如圖3所示。

圖3 多源異構數據的特征級融合Fig.3 Feature level fusion of multi-source heterogeneous data
針對配用電大數據呈現出的種類繁多、多源、不確定等特性,通過將各數據源或監測終端數據信息抽象為特征屬性子集,實現智能配電網下多源異構數據的特征級融合,具體執行步驟如下。
步驟1:多源特征屬性子集基本概率初始化,標記U為智能配電網多源數據融合模型框架,則函數m:2U→[0,1]滿足兩項條件:

式中:m(A)=0為多源數據融合集合A的初始值,而m(A)的大小代表對其的信任程度。
步驟2:定義信任函數(belief function)計算不同數據融合集合的信任函數值。

式中:Bel(A)為多源數據融合集合A中所有子集分配概率值之和,每項分配概率值表示了該項子集中特征屬性組成的信任程度值,表示其中包括的配電網多源特征屬性可實現最基本的數據融合。
步驟3:定義多源數據融合似然函數(plausibility function)計算融合不確定特征屬性集合的信任程度值,不確定特征屬性的可利用成分取決于所求解的成分可信度值?,計算函數如下:

式中:pl(A)為對多源數據融合集合A似乎可能融合的不確定性特征屬性的度量為集合A融合不確定性特征屬性時沖突成分可信度值。
步驟4:計算數據融合的信任空間。根據信任函數和似然函數之間的關系:pl(A)≥Bel(A),A?U,A的不確定性可以表示為

式中:pl(A)-Bel(A)為信任空間,表示多源數據融合過程中根據配電網計算實際應用允許變動的不確定性特征屬性。
步驟5:多源異構數據特征屬性合成。對于?A?U,智能配電網多源數據融合模型框架U上的有限個mass函數m1,m1,…,mn的Dempster合成規則為


根據合成規則,利用不同源中數據特征屬性索引實現特征級數據融合。
為驗證文中所提基于邊緣計算的智能配電網多源數據處理與融合技術的有效性與可靠性,以某地區配電網為例,配電網IEEE14節點仿真拓撲如圖4所示。算法通過Matlab2019a實現,選取同一時間周期的配電網運行數據、終端監測數據、環境信息數據為實驗多源數據,分為兩個實驗分別測試多源數據標準化變換處理方法,以及在數據處理的基礎上進行多源數據特征級融合的可行性。

圖4 配電網IEEE14節點仿真拓撲圖Fig.4 Simulation topology diagram of IEEE14 nodes in distribution network
實驗1:多源數據標準化變換處理。
配電網運行量測主要使用配網數據采集與監視控制系統(supervisory control and data acquisition,SCADA)數據;終端監測數據主要使用配網故障分布式系統(system of malfunction distribution,SMD)數據;有關環境信息數據使用氣象網公開數據,主要包括時間點、經度、緯度、溫度、風速、氣壓等對配電網影響顯著的特征屬性數據。各數據源分別從屬不同數據采集系統,數據格式復雜多樣、結構差異較大,極大地限制了配電網邊緣化的混合計算。經多源數據標準化變換處理前后結果對比如圖5、圖6所示。

圖5 多源數據處理前結果Fig.5 Results before multi-source data processing

圖6 多源數據處理后結果Fig.6 Results after multi-source data processing
為了避免處理方法的偶然性,以6~11線路為例,隨機抽取10條觀測序號展示結果。在經本文所提基于BC-Zscore的配電網多源異構數據標準化處理方法處理后三個不同格式、量綱、數據類型以及數量級的數據源特征屬性處理結果值如表1所示,單位均為標幺值。
實驗表明,通過對一周內的連續原始數據進行基于BC-Zscore的多源數據標準化處理,該方法有效實現了對各數據源特征屬性的格式、量綱、數據類型以及數量級的統一變換處理,通過表1實驗結果可以看出,各數據源特征屬性變換后每個元素的絕對值取值均在0~1之間,明顯消除了多種不一致因素產生的限制,為后續的智能配電網邊緣化數據融合計算和信息挖掘奠定了基礎,保證了配電網的穩定計算控制和重要信息的深度挖掘。
實驗2:多源數據融合。
智能配電網各種高級應用計算均建立在多源數據融合計算的基礎上,利用多源數據處理結果,圍繞配電網自然災害故障信息診斷與挖掘這一實際應用場景需求,進行數據的特征級融合。以運行數據源、終端監測數據源、環境信息數據源為對象,結合應用場景需求分析多源信息構成及關鍵特征屬性,各數據源在故障信息診斷與挖掘中融合占比圖如圖7所示。

圖7 多源異構數據源融合占比Fig.7 Proportion of multi-source heterogeneous data source fusion
根據多源異構數據特征屬性合成規則,對多源數據進行分類組合與融合,數據融合過程中不同信任函數值與似然函數值下信任區間變化如圖8所示,尋找最佳數據融合點,保證穩定度的前提下盡可能多的融合不確定特征屬性。

圖8 數據融合過程中的信任區間變化Fig.8 Change of confidence interval during data fusion
為了驗證文中提出PCA-DS推理的多源數據融合結果在后期配電網自然災害故障信息診斷與挖掘的高準確性。對一周內經BC-Zscore多源數據處理后的實驗結果值分別采用DS推理法、BP神經網絡與DS推理法結合算法(BPNN-DS)及文中算法(PCA-DS),三種算法進行融合效果對比實驗,三種實驗融合結果在后期診斷分析中準確率變化如圖9所示。

圖9 三種算法結果值在后期診斷分析中的準確率對比Fig.9 Comparison of the accuracy of the results of the three algorithms in the later diagnosis analysis
由圖9實驗結果可知,基于PCA-DS推理的多源數據融合模型有效地實現了從數據源頭、特征屬性等不同角度出發,對多源異構數據進行分組聚合。根據融合過程中信任區間的收縮變化,提高了多源數據分布特征的擬合精度。同時,通過考慮多源數據融合的配電網自然災害故障信息診斷與挖掘對比結果可以看出,文中利用定義成分可信度函數約束DS推理過程中不確定特征屬性融合,大幅提高了DS推理在多源數據融合中的穩定性和準確性,而且有效融合方法下的多源信息合成進行配電網場景應用分析計算結果值明顯優于僅考慮單一或少量因素的傳統方法。
文中提出了一種基于邊緣計算的智能配電網多源數據處理與融合技術,該技術的提出在一定程度上加快了邊緣計算技術在智能配電網中的應用,同時又為配電網后續的高級計算和應用決策分析提供了保障。通過深入分析配電網智能化建設過程中海量異構數據造成的存儲混亂與融合計算性能不足的問題,設計了一種充分考慮邊緣計算模式下的配用電數據處理與融合架構,其中的廣義冪變換Zscore多源數據變換處理方法,有效地實現了多種配電網數據采集系統下量綱與量級的統一;基于沖突優化DS推理的數據融合模型,根據智能配電網高級應用場景需求預先實現了高精度的特征級配用電數據融合,進一步為配電網邊緣智能化計算和高級應用奠定了基礎,滿足了智能配電網在運行狀態評估、故障信息診斷挖掘、突發事件數據可信度識別等高級應用中高可靠性的需求。