王小強,周珂宇
(國網重慶銅梁供電公司,重慶 402560)
隨著移動互聯技術、人工智能等現代信息技術的飛速發展,如何實現智慧用電管理系統中電力客戶的優化管理就成為電力企業亟待解決的技術問題。現有技術對電力用戶數據信息感知能力比較差,信息處理效率較差,數據靈活利用能力比較差。
針對上述技術問題,文獻[1]方法在電力大數據的基礎上,實現客戶立體畫像的構建,該技術應用“互聯網+”戰略技術,提高了電網企業對數據信息的分析能力,但是當數據信息維度較多的情況下,就顯得無能為力,數據分析能力較差。針對文獻[1]方法的不足,文獻[2]方法基于多維類別特征識別和角點標識構建了智慧用電管理系統中電力客戶立體畫像,通過采用空間特征域分類方法實現用戶畫像信息分類處理,利用多尺度逐層分析方法進行模糊電力客戶畫像的精準定位。這種方法雖然提高了客戶立體畫像的用電類別特征量應用能力,降低了立體畫像的誤差修復水平,但是對于立體畫像數據信息的分類能力,仍舊顯得捉襟見肘。
客戶立體畫像能夠反映電力用戶各種用電信息特征,通過構建立體畫像能夠直觀顯示用戶用電情況等。通過畫像數據特征提取,實現對電力用戶消費行為的分析[3],進而提高用戶畫像分析能力,對提高電力數據信息的掌控與應用有很大幫助。電力數據客戶立體畫像系統整體架構設計如圖1所示。

圖1 電力數據客戶立體畫像系統整體架構設計
電力數據客戶立體畫像系統主要包括電力用戶數據層、電力用戶數據融合層、數據標簽抽取層、數據標簽分析層和標簽畫像應用層。研究所提方法通過構建立體畫像,將電力用戶消費的宏觀行為轉換為微觀數據進行分析,用多維度、多業務、多指標、多特征的數據信息構成電力用戶特征的信息標簽庫,在電力用戶數據層能夠實現不同用電信息的獲取,在電力用戶數據融合層實現不同數據信息的融合[4,5]。在數據標簽抽取層對不同維度和種類的電力用戶數據信息進行數據信息特征提取,通過構建電力分析模型,實現對不同電力用戶消費行為數據的分析,分析結果通過標簽畫像應用層輸出,以顯示用戶的用電情況,對用戶消費行為進行全方面的把控。
研究所提方法通過標簽構建實現對不同用戶消費行為的標識,然后通過聚類算法實現對不同電力行為數據標簽的抽取、標記、分析和應用,提取出不同客戶群體具有的用電特征[6],從而實現不同用電群體的差異化服務。客戶用電標簽信息如表1所示。
基于上述屬性描述,下面是通過示例性描述標簽標記的數據信息,如圖2所示。

圖2 標簽信息示意圖
不局限于上述幾種形式的標簽,也可以采用其他標簽表示其他含義。通過這種標簽定義,再對標簽進行數值化信息處理,比如將不同的標簽命名為xi等多種形式[7]。由于標簽種類繁多,在對標簽進行計算、分析和數據挖掘時,研究所提方法采用FCM聚類算法實現對不同數據信息的分類。流程示意圖如圖3所示。

圖3 FCM聚類算法流程示意圖
假設電力用戶消費行為數據信息為N,數據信息的維度為D,則電力用戶消費行為數據信息樣本可以記作為:

(1)
則可以將原始電力用戶消費行為數據信息劃分為不同的小類,通過電力用戶消費行為數據信息數據集合C={c1,…,ci,…,cK}表示。原始電力用戶消費行為數據信息的樣本j隸屬于第i個聚類子集的概數記作為uij,則FCM可以設定以下目標函數:

(2)

(3)


(4)
為了提高對電力用戶消費行為數據信息的分類精度,需要對隸屬度系數和聚類中心函數反復進行數據求導,則輸出的迭代公式可以表示為:

(5)
(6)
經過反復迭代計算,最終輸出目標數據信息。當需要進行進一步的計算時,則返回初始步驟,重新啟動聚類中心,對隸屬度函數和聚類中心函數再次進行求導計算[11],直到FCM函數滿足收斂條件為止,即輸出目標函數達到最大迭代次數或目標函數小于預設值,停止數據計算,最終實現數據的分類。
對電力用戶消費行為數據信息進行標簽分類后,對電力用戶消費行為進行分析。研究所提方法通過構建GM(1,1)模型,最終實現對用電行為的數據分析[12-13]。假設輸入的用電行為分析數據信息序列設定為:
(7)
然后對輸入的數據序列進行一階累加[14-16],則輸出的電力用戶消費行為數據信息序列可以為:

(8)
對輸入的電力用戶消費行為數據信息進行融合,則融合輸出的電力用戶消費行為數據信息函數可以為:

(9)
由于電力用戶消費行為數據信息中x(1)輸出為一階均值,將任何一個電力用戶消費行為數據信息序列值記作為xi,通過線性關系表示為:
(10)
其中k≥3。然后再對電力用戶消費行為數據信息的線性方程求微分,則輸出函數可以為:

(11)
這樣就可以求出a和u的值,在求值過程中,啟動最小二乘法,則輸出的公式可以為:
(12)
其中存在以下恒等式:
通過上述矩陣公式計算后,再對電力用戶消費行為數據信息進行數據還原,則還原公式可以為:

(13)
(14)
其中k≥4。通過這種方式,能夠實現任意時間和區域下對電力用戶消費行為數據信息的精準預測,提高了對電力用戶消費行為數據信息的分析能力[17-19]。
為了驗證研究所提方法的技術方案,采用的硬件配置CPU為Inter Core i7-9700H,運行內存為3200 MHz 8×2 GB,硬盤大小為1 TB[20]。以某電力用戶使用區域80 000戶工業用戶為例進行方案驗證。
為了提高試驗效果,下面從電力客戶立體畫像數據庫中抽取相關數據信息。數據庫信息如圖4所示。

圖4 數據庫信息示意圖
然后采用Matlab軟件進行數據信息仿真。抽取的數據信息標簽分布如圖5所示。
通過圖5可以看出,電力用戶消費行為數據信息分布特性可以為:預期指標相對比較集中,預期指標分布分散,用戶消費類型大部分為工業用電以及商業用電,在不同時令用電下,夏冬季節對溫度比較敏感,并且用電量比較多樣,客戶群體以工業為主,負載穩定性隨著溫度和時令反復變化,電量增長率隨著季節不同,有所區別。通過FCM聚類算法計算后,輸出如表2所示的數據信息。

表2 不同數據信息標簽特征分析
通過表1可以看到,研究所提方法分類效果較為突出,下面將研究所提方法與K-Means算法進行對比。分類對比示意圖如圖6所示。選擇4個不同數據信息的樣本進行對比,假設樣本1-4的數據量為1*103、1*104、1*105和1*106個,則分類對比示意圖如圖6所示。訓練時間為8個小時。
通過圖6可以看出,通過8個小時的訓練,在4組不同的計算小組中,研究所提方法的方法具有突出的技術優勢,準確率較高。
以電能表計量出的數據為例進行說明,從電力客戶立體畫像數據庫中提取的數據信息如圖7所示。

圖5 電力用戶消費行為數據信息客戶標簽分布示意圖
然后通過立體圖像構建,可以得出以下數據信息分析結果,通過電壓和電流數據信息為例進行說明, 如表3和表4所示。

表3 電壓分析誤差結果示意表
通過4個小時的測試,發現電壓誤差低于0.04。經過4個小時的測試,電壓分析誤差結果示意表如表4所示,發現電流誤差低于0.05%。

表4 電流分析誤差結果示意表
然后將研究所提方法與對比文獻[1]方法和對比文獻[2]方法對比。試驗過程中,主要對誤差方面進行分析。誤差對比曲線圖如圖8所示。

圖6 分類對比示意圖

圖7 數據提取數據信息示意圖
通過100分鐘的試驗發現,在進行用戶消費行為數據分析時,相對于對比文獻[1]方法和對比文獻[2]方法,研究所提方法從開始到結束都具有較高的準確度。
然后,用戶再在時間上進行對比分析,假設針對相同的數據量,相對于對比文獻[1]和對比文獻[2]方法,比較耗時情況,對比示意圖如圖9所示。

圖8 誤差對比曲線圖

圖9 耗時對比時間圖
在相同數據量下,相對于對比文獻[1]和對比文獻[2]方法,研究所提方法耗時比較短,說明研究所方法方法分析數據的能力較強,效率也高。
針對大量的電力用戶數據信息,根據所提方法進行了以下技術研究:
(1)構建了一套電力數據客戶立體畫像系統,實現了電力用戶消費行為數據信息數據提取、數據融合、數據標簽設定以及數據分析全過程,將電力用戶消費的宏觀行為通過電力數據客戶立體畫像形象表示出來,提高了對電力數據客戶立體畫像的分析能力。
(2) 構建FCM聚類算法模型,實現不同類型標簽數據信息的分類和計算,最終實現不同數據信息的輸出和應用。
(3)構建灰色GM(1,1)模型,實現不同標簽下的用電行為分析,提高了數據分析能力。
通過實驗,研究所提方法具有突出的技術效果,為下一步技術的研究奠定了技術基礎。