姚煒
摘要:隨著科學技術(shù)的發(fā)展,我國的大數(shù)據(jù)技術(shù)有了很大進展,本文介紹了電力大數(shù)據(jù)技術(shù)和智能用電的服務(wù)結(jié)構(gòu),最后介紹了應(yīng)用電力大數(shù)據(jù)對用戶進行分類,確定用戶用電行為影響因子和對用戶用電行為進行分析的常用研究方法。
關(guān)鍵詞:電力大數(shù)據(jù);數(shù)據(jù)挖掘;用戶分類;影響因子;用電行為分析
引言
電力系統(tǒng)越來越多地采用數(shù)字信息和通信技術(shù),為實施大數(shù)據(jù)挖掘和分析提供了機會?;谙冗M數(shù)據(jù)分析的決策支持在智能電力系統(tǒng)的形成、運營和管理中發(fā)揮著越來越重要的作用。近年來,智能電網(wǎng)和智能電表已得到廣泛部署。
1電力大數(shù)據(jù)技術(shù)
電力大數(shù)據(jù)的采集、分析以及應(yīng)用技術(shù)繁瑣,其過程分為:電力數(shù)據(jù)采集,數(shù)據(jù)預(yù)處理與分類,數(shù)據(jù)存儲與管理,數(shù)據(jù)挖掘與分析和數(shù)據(jù)應(yīng)用五個大步驟。電力數(shù)據(jù)采集是電力數(shù)據(jù)分析應(yīng)用的前提和基礎(chǔ),數(shù)據(jù)整合端通過實時數(shù)據(jù)采集、文件數(shù)據(jù)采集和離線數(shù)據(jù)抽取完成電力數(shù)據(jù)的采集任務(wù)。數(shù)據(jù)整合端的數(shù)據(jù)采集過程包括數(shù)據(jù)感應(yīng)與識別技術(shù),數(shù)據(jù)壓縮與加密技術(shù),以及數(shù)據(jù)傳輸與通信技術(shù)等。數(shù)據(jù)預(yù)處理與分類是將電力大數(shù)據(jù)進行過濾篩選,去粗取精,并對數(shù)據(jù)進行辨識和整合分類處理,經(jīng)過預(yù)處理與分類后的數(shù)據(jù)更加清晰有條理,便于數(shù)據(jù)的存儲。數(shù)據(jù)預(yù)處理的關(guān)鍵任務(wù)是將種類繁多、結(jié)構(gòu)復(fù)雜的電力大數(shù)據(jù)篩選并處理成類型單一、結(jié)構(gòu)簡單的電力數(shù)據(jù)后再進行歸類處理。數(shù)據(jù)存儲與管理主要是將采集分類后的數(shù)據(jù)及時存儲,建立相應(yīng)的數(shù)據(jù)庫,便于數(shù)據(jù)分類管理與調(diào)取,解決了電力大數(shù)據(jù)量大、存儲難度大和調(diào)用困難的難題。數(shù)據(jù)存儲與管理涉及大數(shù)據(jù)存儲技術(shù)、大數(shù)據(jù)管理技術(shù)、大數(shù)據(jù)融合技術(shù)、大數(shù)據(jù)檢索技術(shù)和大數(shù)據(jù)可視化技術(shù)等,它是多種類型的大數(shù)據(jù)處理技術(shù)的融合。數(shù)據(jù)挖掘與分析是通過計算機借助數(shù)據(jù)統(tǒng)計、機器學習、神經(jīng)網(wǎng)絡(luò)和模糊算法等方法對電力數(shù)據(jù)信息進行分析計算并挖掘數(shù)據(jù)中隱含的信息與數(shù)據(jù)間的潛在聯(lián)系,最后將這些聯(lián)系與規(guī)律表示出來,供日后的研究學習作參考。
2智能用電的服務(wù)結(jié)構(gòu)
作為智能電網(wǎng)的關(guān)鍵組成部分之一的智能用電是基于先進的計量技術(shù)、雙向交互式電表、高性能控制技術(shù)、高速通信技術(shù)、快速存儲技術(shù)、電能數(shù)據(jù)采集終端、以及實時營銷系統(tǒng)等先進技術(shù)。此外,融合需求側(cè)管理和需求響應(yīng)的現(xiàn)代管理理念對于實現(xiàn)智能用電也具有重要意義。電能數(shù)據(jù)采集系統(tǒng)是智能用電服務(wù)架構(gòu)中的關(guān)鍵部件之一,通過該系統(tǒng)可以實時收集、處理和監(jiān)控不同電力用戶的電力使用信息。智能電網(wǎng)中電能數(shù)據(jù)采集系統(tǒng)的主要功能包括汽車充電使用信息采集、在線監(jiān)測、成本控制管理、有序用電管理、電能質(zhì)量監(jiān)測、采集數(shù)據(jù)發(fā)布、采集維護監(jiān)控和電力使用行為分析。電能數(shù)據(jù)采集系統(tǒng)由主站系統(tǒng)、傳輸通道、采集終端和智能電表組成。電能數(shù)據(jù)采集系統(tǒng)由四層組成:用戶層、數(shù)據(jù)采集層、網(wǎng)絡(luò)層、數(shù)據(jù)存儲分析和應(yīng)用層。對于第一層中的各種電力用戶,通過智能電表和第二層中的其他數(shù)據(jù)獲取終端實時收集電力消耗數(shù)據(jù)。通過第三層中的自建專有網(wǎng)絡(luò)或第三方公共網(wǎng)絡(luò),大規(guī)模的電力消耗數(shù)據(jù)被傳輸?shù)椒?wù)器。數(shù)據(jù)存儲、分析和營銷應(yīng)用在第四層進行。
3用戶用電行為影響因子確定
(1)自我影響因子。自我影響因子主要是指由于用戶自身原因?qū)τ脩粲秒娦袨楫a(chǎn)生影響的影響因子,一般涉及用戶的用電計劃變化、自身重大用電事故等,這類影響因子可以根據(jù)用戶的歷史用電數(shù)據(jù)變化或用戶的用電計劃變化分析得出,在用戶的用電計劃未知的情況下可以將足夠大的歷史用電數(shù)據(jù)進行一些分析計算,預(yù)測用戶的用電計劃。(2)自然環(huán)境影響因子。自然環(huán)境影響因子是指用戶的用電行為受到自然環(huán)境變化的影響,主要包括溫度、濕度、風力、天氣以及季節(jié)的變化對用戶用電行為的影響,這類影響因子結(jié)合用戶的用電行為曲線與氣象曲線對比得出,添加恰當?shù)臄?shù)理分析方法可以篩選出電力大數(shù)據(jù)中受自然環(huán)境影響因子影響的電力數(shù)據(jù)。(3)社會環(huán)境影響因子。社會環(huán)境影響因子主要包括國內(nèi)節(jié)假日以及重大國家事件對用戶用電行為的影響,如春節(jié)、黃金周、APEC和十九大會議等對用戶行為的影響。由于此類影響因子的隨機性與不確定性因素較大,因此該類影響因子有時需要手動選擇并篩選。分析可能影響用戶用電行為的影響因子,并對不同種類的影響因子進行準確的篩選可以使電力數(shù)據(jù)更具代表性,使基于電力大數(shù)據(jù)的用戶用電行為分析結(jié)果更加特性鮮明,用戶用電行為特征更加明顯,基于用戶用電行為特征的分析預(yù)測更加準確,更有利于實現(xiàn)電網(wǎng)資源的優(yōu)化配置。
4基于電力大數(shù)據(jù)的用戶用電行為分析
目前,比較常用的用戶用電行為分析方法是聚類分析法。行業(yè)中普遍使用的聚類分析方法為基于k-means的聚類算法。k-means算法有效解決了經(jīng)典的聚類問題,處理問題快速、簡單,這種方法雖然具有一定的高效性以及伸縮性,但是用這種方法所得的聚類結(jié)果對初值的敏感度比較高,初值不同所產(chǎn)生的結(jié)果也不同,如果初值選擇不合理,就會導(dǎo)致聚類結(jié)果出現(xiàn)偏差,因此面對用電數(shù)據(jù)比較大的電力用戶時,這種方法并不適用。模糊聚類算法中使用比較廣泛的是模糊C均值聚類算法,這種方法能夠通過對目標函數(shù)予以優(yōu)化獲取每個樣本點對不同類中心的隸屬度,樣本點隸屬的判斷需要以實現(xiàn)樣本數(shù)據(jù)分類為目標。但是,使用模糊C均值類算法對離散數(shù)據(jù)點集合進行處理時,無法處理類型比較特殊的數(shù)據(jù),無法對數(shù)據(jù)是否具備聚類結(jié)構(gòu)進行判斷,并且在選擇初始值時具有較強的依賴性。一些學者提出了以云計算為基礎(chǔ)的電力大數(shù)據(jù)聚類問題的計算方法,這種方法能夠同時處理大量數(shù)據(jù),并且速度也比較快,但是在具體使用過程中,因Hadoop讀寫比較頻繁,而且包含的數(shù)據(jù)量比較大,很容易產(chǎn)生性能方面的問題。對于大數(shù)據(jù)用戶用電行為,使用經(jīng)典聚類算法進行分析的時候存在問題,因此出現(xiàn)了很多改進算法,比如,以云計算為基礎(chǔ)的k-means算法、以SparkR為基礎(chǔ)的并行化k-means算法等。對電力大數(shù)據(jù)用戶的用電行為進行分析的時候,使用云計算k-means算法有利于開發(fā)大規(guī)模的數(shù)據(jù)并對其進行處理,還能夠顯著提升處理能力,使數(shù)據(jù)處理更加高效。運用云計算,能夠在數(shù)據(jù)庫中存儲海量的電力大數(shù)據(jù),并且借助k-means計算模型高效分析數(shù)據(jù)。目前,在電力大數(shù)據(jù)平臺中比較常用的電力大數(shù)據(jù)用戶用電行為分析方法是以云計算為基礎(chǔ)的k-means算法。以SparkR為基礎(chǔ)的并行化k-means算法能夠有效解決設(shè)備性能問題以及頻繁讀寫可能存在的錯誤情況,其將Hadoop的電力大數(shù)據(jù)群作為數(shù)據(jù)引擎,再運用k-means算法充分發(fā)揮了大數(shù)據(jù)R語言以及大數(shù)據(jù)內(nèi)存計算的特征,有效提升了數(shù)據(jù)分析能力。
結(jié)束語
總而言之,電力行業(yè)的數(shù)據(jù)價值高且數(shù)據(jù)量比較大,提高數(shù)據(jù)的利用率能夠有效提升電力企業(yè)的營利水平,無論將其應(yīng)用于行業(yè)內(nèi)還是行業(yè)外,都會帶來新的發(fā)展機遇。與此同時,這在一定程度上挑戰(zhàn)了大數(shù)據(jù)的認知水平,如何有效處理這些數(shù)據(jù),并從中獲取更有價值的信息,最終將其轉(zhuǎn)化成優(yōu)化的服務(wù)決策以及管理模式是決定大數(shù)據(jù)價值能否得以體現(xiàn)的關(guān)鍵。
參考文獻
[1]歐陽昱,劉輝舟,李周,等.通過電力大數(shù)據(jù)發(fā)現(xiàn)低壓用戶用電模式的研究[J].信息技術(shù),2019(2):129-135.
[2]殷蔚翎.能源互聯(lián)網(wǎng)形勢下的電力大數(shù)據(jù)發(fā)展趨勢[J].計算機產(chǎn)品與流通,2018(10):64.
[3]龍禹,吳尚遠,高騫,等.基于B+樹的電力大數(shù)據(jù)混合索引設(shè)計與實現(xiàn)[J].自動化與儀器儀表,2018(9):67-69.