




摘 要:電力用戶行為數據具有復雜性和多樣性,因此用戶行為數據呈現出極大的差異性和不確定性,導致電力用戶行為意圖挖掘難度增加、挖掘率較低。本文針對上述現象,提出基于時間特性的電力用戶行為意圖挖掘方法。通過預處理和降維方式處理電力用戶行為負荷數據,利用先進的特征提取技術,在處理后的數據中提取電力用戶行為意圖特征,考慮時間特性,揭示電力用戶行為背后的意圖和規律,以達到挖掘電力用戶行為意圖的目的。試驗結果表明,本文方法能夠將復雜的電力用戶行為負荷數據轉化為有價值的意圖特征,挖掘率較高,有助于理解用戶的日常用電模式,為電力系統的優化調度和資源配置提供有力支持。
關鍵詞:時間特性;電力用戶;用戶行為意圖;挖掘方法
中圖分類號:TM 714" " " " " 文獻標志碼:A
基于時間特性的電力用戶行為意圖挖掘方法是在電力大數據背景下深入分析用戶用電行為的重要手段。在電力大數據中,用戶用電數據占較大比例,對理解用戶行為、優化電力資源配置等方面具有重要價值。但是電力消費數據具有規模大、維度高、來源多、時效特征強和價值密度低等特點,與海量的社會經濟環境數據有緊密關聯[1],現有的研究手段很難有效解決這一問題,也不能挖掘其中的有用信息。因此,本文提出基于時間特性的電力用戶行為意圖挖掘方法。該方法分析了用戶用電負荷數據的時間序列,結合用戶的用電信息,挖掘用戶的用電行為意圖,可幫助電力企業更好地了解用戶的用電行為規律,優化電力資源配置,提高電力供應的可靠性和經濟性。綜上所述,本文基于時間特性的電力用戶行為意圖挖掘方法旨在提高電力數據的應用質量,為電力企業的決策支持、資源配置和市場營銷等方面提供有力支持。
1 處理電力用戶行為負荷數據
采用預處理和降維處理方式對用戶電力負荷數據進行處理。在預處理階段,設定異常值規則,將任何距離平均值超過3倍標準差的數據點均視為異常值,并從數據集中移除。在此基礎上,本文提出一種基于Z標準化的方法,即將原始數據轉換成一個均值為0且標準偏差為1的新的數據集合[2]。具體過程如下所示。
假定原來的每日負載數據是X={x1,x2,…,xn},從原日負荷數據中剔除離群點,Z標準化后得到X={x'1,x'2,…,x'n},如公式(1)所示。
(1)
式中:xi和x'i分別為第i個時間的實際用電負荷和歸一化后的用電負荷;n為一天中的負荷取樣點數;μ和σ分別為每日負荷數據的平均值與標準偏差;i為時刻。
采用分段聚合近似法降維處理數據[3],采用降維處理,可得精簡的日負荷數據為={,,…,},如公式(2)所示。
(2)
式中:w為負荷曲線PAA表示的分段數;為該段中數據的值;x'j為未簡化前的日負荷數據。
由此完成電力用戶行為負荷數據處理。
2 提取電力用戶行為意圖特征
為了更有效地提取電力用戶行為意圖的特征,在處理電力用戶行為負荷數據的基礎上,本文提出一種基于堆棧自編碼器和無監督學習的自適應特征選擇算法[4]。AE模型結構如圖1所示。
編碼器將x從輸入層投射到隱藏層h=[h(1),h(2),…,h(m)],其中m為隱藏層可變矢量的維數。映射函數f(x)=sf(Wx+b),其中W為n×m維權重矩陣,b為偏差向量。在解碼器中,通過映射函數f將隱藏層表示的h映射到輸出層x,映射函數為f(h)=sg(Wh+),為平均偏差向量[5]。
利用公式(3)將平均重建誤差以最小的方式進行重建,求出自編碼器的模型參數,并采用梯度下降法更新自編碼的參數,在滿足|x-x|無限逼近于0的條件下,將當前自編碼器的參數保存為訓練好的自編碼器參數[6]。
(3)
式中:J為損失函數;xi為輸入自編碼器中的原始數據樣本;xi為自編碼器通過編碼和解碼過程后重構出的數據樣本;N為數據樣本的總數;為平均偏差向量;b為偏差向量;?為權重矩陣。
堆棧自編碼器由多個自編碼器逐層連接而成,第i個編碼器將原始數據映射到第i個隱藏層,再將第i個隱藏層數據作為第i+1個自編碼器的輸入,訓練第i+1層隱藏層得到參數{Wi+1,bi+1},并把該隱藏層數據作為下一個AE的輸入。采用這種方式逐層訓練整個堆棧自編碼器。多個自編碼器堆疊起來后結構如圖2所示。
圖2所示的自編碼器屬于無監督學習方法。自編碼器通…過最小化損函數多次迭代來使輸出與輸入的誤差盡可能接近于0。訓練好的自編碼器隱藏層數據被視為降維后的特征數據[7]。在上述基礎上,為了更好地自適應選擇用戶行為意圖數據的特征,本文提出基于K-Means聚類算法的用戶行為特征自適應選擇方法,整體框架如圖3所示。
利用K-Means聚類算法聚類分析降維后的特征值,通過聚類,將具有相似行為意圖的用戶進行分組,進一步提取能夠代表不同行為意圖的特征。根據K-Means聚類的結果,提取每個聚類中心的特征向量,將這些電力用戶行為意圖特征的時間序列記作A=[a1,a2,…,am],代表不同行為意圖用戶的典型特征。
3 基于時間特性挖掘電力用戶行為意圖
為了更全面、深入地理解用戶行為的動態特性和演變模式,本文基于這些時間序列的電力用戶行為意圖特征進行聚類分析。
分析時間序列時,需要度量相似性,為了精確衡量2個時間序列間的相似程度,采用互相關的方法。將2個電力用戶行為意圖特征時間序列分別記作序列A=[a1,a2,…,am]和序列B=[b1,b2,…,bm]。為了全面比較這2個序列的全局特征,設定一個平移窗口,逐步移動序列A,如公式(4)所示。
(4)
式中:As為由序列A時間窗平移s個單位;am為時間序列元素;s為時間窗平移單位個數。
根據公式(4)得出A、B的互相關序列,如公式(5)所示。
Eω(A,B)=[e1,e2,…,eω,…,e2m-1] (5)
式中:ω和m為移動位次。
進一步得出基于時間特性的電力用戶行為意圖相似性度量函數R,如公式(6)所示。
(6)
式中:L0(A,A)、L0(B,B)分別為序列A、B相對位移0的相關值;R(A,B)為0時,表示序列A、B完全相似[8]。
相似性度量的提取目標為序列A、B間的相似性,而非差異性,將斯坦納樹優化問題轉化為求解相似性最大化問題,可得公式(7)。
(7)
式中:Pk為第k類聚類數據集合;n為聚類總數;ui為電力用戶行為意圖聚類數據集合中第i條聚類數據;uk*為矩陣M最大特征值對應的特征向量,即電力用戶行為意圖各類聚類中心曲線;uk為矩陣M最小特征值對應的特征向量。
聚類流程如圖4所示。1) 輸入聚類數k,指定零向量作為初始化聚類中心。2) 利用時序相似性度量函數計算時序數據集U中各時間序列ui到各聚類中心R的距離c,同時把ui歸類到與零向量距離最小的第i類中[9]。3) 提取每類聚類形態的聚類中心曲線。4) 重復步驟2、3,當聚類中心不再變化時停止迭代,聚類完成,得到電力用戶行為意圖,如公式(8)所示。
(8)
式中:ε為距離閾值;c為時序數據集U中各時間序列ui到各聚類中心R的距離。
通過觀察每個聚類的中心曲線和特征分布,揭示不同用戶群體的行為模式、動態特性和演變規律。結合其他相關信息和背景知識,深入挖掘用戶行為意圖的深層含義。
4 試驗
4.1 試驗準備
為了驗證本文方法的有效性,進行電力用戶行為意圖挖掘試驗。首先,選擇適當的硬件資源,CPU型號為Intel Xeon Gold 6248R,GPU型號為NVIDIA GeForce RTX3090,配置256GB的內存和SSD存儲類型,以滿足大數據處理的需求。其次,對軟件環境的相關配置,本文選擇Ubuntu20.04的操作系統,編程語言采用Python3.8。最后,對于數據處理和可視化工具,本文將Pandas和NumPy庫作為數據處理庫,將Matplotlib和Seaborn工具作為可視化工具。具體試驗環境參數見表1。
進而收集電力用戶用電數據,需要考慮不同地域的用電習慣和模式差異,保證數據能反映不同地區的獨特行為。收集到的數據見表2。
這些數據反映了不同用戶在總用電量、高峰和低谷時段用電量的差異,有助于進一步分析用戶的用電行為模式和特點。將收集到的數據進行預處理,提取與用戶行為意圖相關的特征,按照設計部分內容挖掘電力用戶行為意圖。保證試驗覆蓋的用戶群體具有足夠的多樣性,包括不同年齡、職業和收入水平等,以反映不同用戶群體的獨特用電意圖。
4.2 試驗結果和分析
為了驗證本文方法在電力用戶行為意圖挖掘中的優越性,將其與基于事件驅動的挖掘方法和基于用戶畫像的挖掘方法進行比較,得到電力用戶行為意圖挖掘率的比較結果,見表3。
由上述試驗結果的比較數據可知,在所有試驗條件下,本文方法的行為意圖挖掘率均高于基于事件驅動的方法和基于用戶畫像的方法。表明使用本文方法處理電力用戶行為意圖挖掘任務時精度更高,特別是在條件2和條件6下,本文方法的挖掘率分別為92.45%和91.56%,顯著領先于其他2種方法。基于事件驅動的挖掘方法需要對特定事件進行檢測和分析,在事件定義和檢測方面可能存在一定的主觀性和局限性,從而影響了挖掘率的準確性。基于用戶畫像的挖掘方法雖然能夠綜合考慮用戶的多個維度信息,但是構建用戶畫像時可能面臨數據稀疏性和用戶行為多樣性的挑戰,導致挖掘率受限。本文方法基于時間特性,自動學習并捕捉用戶行為模式與意圖間的復雜關系,從而提高了挖掘的準確性,可為電力公司提供更準確的用戶行為分析,優化電力資源配置,提高運營效率。
5 結語
本文對電力用戶用電負荷數據進行了深入剖析,揭示了用戶用電行為的時間特性及其背后的意圖。該方法能夠更精準地把握用戶的用電需求,為電力資源的優化配置和電力服務的個性化提供有力支持。但是,本文研究仍存在一些不足之處。例如在數據處理和分析過程中,可能受數據質量、數據完整性等因素的影響,導致分析結果存在一定偏差。后續研究將致力于提高數據處理的精度和效率,減少數據質量對分析結果的影響。
參考文獻
[1]練琳,盧萬平,黃家寶.基于MESCM算法的電網用電行為智能識別[J].電子設計工程,2024,32(5):127-130,135.
[2]吳昀烔,趙健,宣羿,等.基于多維負荷特性挖掘的電力特殊用戶用電行為分析[J].電力建設,2024,45(3):116-125.
[3]費飛,翁利國,壽挺,等.基于數據挖掘的電力用戶行為特征分類研究[J].自動化技術與應用,2023,42(11):101-104,117.
[4]洪居華,洪蘭秀,李源非,等.基于自適應權重特征聚類的用戶用電行為分析[J].計算機應用與軟件,2023,40(11):341-349.
[5]萬偉,劉紅旗,杜單單,等.考慮負荷季節特性的電力用戶用電行為畫像[J].哈爾濱理工大學學報,2023,28(3):45-55.
[6]李冀,趙成,羨慧竹,等.基于k均值聚類算法的用電數據行為分析[J].電子技術,2023,52(4):319-321.
[7]武靈耀,郭賀宏,趙慶生,等.基于MACD指標與聚類算法的電力用戶用電行為分析[J].上海電力大學學報,2023,39(2):105-111.
[8]趙爽,阮俊梟,支剛,等.考慮尖峰負荷特性指標的用戶用電行為分析[J].內蒙古電力技術,2022,40(5):39-45.
[9]張潔,夏飛,袁博,等.基于特征優選策略的居民用電行為聚類方法[J].電力系統自動化,2022,46(6):153-159.