孫常鵬 戴斐斐 張耀心 季忠


摘要:新世紀下,電力企業在日常經營管理中,每天都會產生大量的數據信息,如輸變電設備管理、運行、檢修、電網維護等方面的數據。面臨如此紛繁復雜的多維大數據集,電力企業常常很難迅速找到需要的有效信息。所以,應積極引進數據挖掘專業技術,來從這些海量的數據集當中,便捷地提取要用到的資料,并加以分析和處理。基于此,本文從電力企業出發,主要探討了數據挖掘專業技術在大數據方面的應用,僅供參考。
關鍵詞:大數據;電力企業;數據挖掘
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1007-9416(2020)09-0051-03
在大數據時代下,電力企業獲得了長足的發展,其中大數據起到的作用也越來越重要[1]。從電力企業角度來看,通過數據挖掘專業技術可以從各種電力大數據中,及時挖掘得到利用價值高的數據信息,不以此為基礎來提供給電力企業重要的決策、規劃、發展參考依據。
1 數據挖掘概述
1.1 基本流程
(1)商業分析理解。立足商業角度,從商業基礎目標著手,全面了解電力業務訴求及其終極目標,再有機結合業務訴求和電力數據挖掘和其結果。(2)數據分析理解。針對電力業務當中形成的真實數據,根據業務場景和訴求,統一評估、選取分析。(3)準備好數據。針對電力業務中,原始的有用數據,根據業務模型,積極組織、清洗,以滿足建模方面的要求。(4)規范建模。通過聯合諸多種建模技術,來規范校準電力業務數據及建模參數。具體任務是創建數據模型、規則化關聯數據、分類聚類和預測、檢測異常性等。(5)過程評估。嚴格檢測挖掘的數據結果和電力業務目標之間的吻合性,確定數據模型能不能滿足電力業務訴求需要。(6)統一部署。通過統一部署數據模型,以挖掘結果為依據,形成一份專業化的報告。
1.2 常用方法
(1)異常分析法。通過異常分析法,旨在稽查電力防盜使用。在國家電力系統,非正常運用電力,常常會產生異常或孤點數據[2]。其中異常數據指的是非正常操作下的電力數據,而孤點數據則指的是與正常電力偏離較遠的點。在稽查過程當中,電力企業及偵查機關可統一收集分析用戶的電力數據,研究數據的異常情況。這么一來,便能從眾多用戶當中,大幅縮小調查分析范圍,及時監控違法行為,令電力使用更加合理合法。(2)關聯分析法。在數學、經濟等領域的數據分析中,關聯分析法屬于一種常用的簡單方法。從電力企業上看,通過關聯分析法旨在分析兩個或以上事物之間的關系。然后,利用其他事物來預測其中某事物,進而深挖在事物間隱藏存在的數據聯系,得到要用的數據信息。(3)時間序列法。作為動態分析法之一,時間序列法主要通過時間數列、統計等,來處理分析數據。從電力企業來看,通過時間序列法可以統計分析電力的整體使用趨勢、變動情況、無序或循環波動等,從而獲得要用的數據信息。(4)聚類分析法。通過聚類分析法,旨在分析數據的基本性質及特征,歸類性質相近的事物,而性質差異明顯的就歸入別的種類之中。不同于判別分析的是,這種方法會先按既有事物性質,通過一定的函數法,來判斷性質未知的事物,并在性質已知的事物里加以歸入。在應用聚類分析法時,往往并不知曉分析對象的具體類別,來分類處理數據信息。(5)分類分析法。分類分析法主要用于分類有關信息,通過分類模型,一般會分析分類集中得到的某些數據,而獲得其他的數據,如離散變量預測分類、連續變量預測回歸等。
2 電力企業內部的大數據現狀
2.1 結構化與半結構化信息數據
在信息時代下,互聯網應用具有大幅增長非結構化數據、半結構化數據的特征。據有關統計可知,以上數據已占據超過75%的數據總量。而數據的網絡化又迫使這類數據普遍存在復雜關系。此外,這些數據的形式就是數據流,價值化體現和時間之間具有顯著相關性,且價值會稍縱即逝。雖然當前的計算機智能化進步明顯,但是僅僅可以分析有結構數據或者類結構數據,所以缺失深層次挖掘數據的效果。
2.2 收集數據
在大數據時代下,電力數據除了涵蓋歷史內部數據外,還涉及互聯網、信息部門的數據。在收集信息時,應附上必要的時空標志,如果有必要還應剔除其中的無效數據。此外,還要盡量收集數據來源各異、結構化水平不一樣的數據,并盡量對照企業歷史數據,以方便驗證數據的真實可靠度,所以存在一定的難度。
2.3 數據關系
通過觀測大量的數據,盡管能夠映射出復雜多變的網絡,但是這些數據一般孤立存在,不免會映射出片面的數據網絡。所以,應有效集成數據,形成一個統一的數據網絡。例如,在發電企業中,如果只考慮發電量,則只能得到發電量方面的數據。但發電數據又關乎電壓、線損、用電等方面的數據。通過一定的分析法,確定數據之間的關系及復雜網絡的聯系,是發電企業必須面臨的挑戰。此外,發供電企業當前缺少統一的信息化系統,所以電力生產、銷售等方面的數據往往相互獨立存在。為了打破信息孤島現狀,就應融合多方面數據,如發輸電、變配用電等的數據。
3 在電力企業大數據的數據挖掘技術應用
3.1 從數據源頭上收集大數據
借助現代化設備和技術,如移動設備、自動記錄技術、射頻識別無線專業技術、互聯網等,電力企業將自身的事務型數據與具有決策性作用的外部性質數據,存儲到了數據來源層。而為了獲得更典型的數據,電力企業還應試著從各種數據源頭,收集大數據,以準備好后續數據挖掘的事宜。
3.2 在數據管理上的應用
在數據倉庫中,常常會存儲通過整理、轉化過來的電力數據。因為電力數據庫不同時,儲存標準也會不一樣,所以應做好整合轉化后,方才可在數據倉庫中儲存,也即應重新設計數據倉庫[3]。數據倉庫被重新設計后,便能夠按主題要求,設計相應的屬性集,以降低處理量。就主題各異的數據庫,可通過屬性歸約法,技術刪除冗余信息,獲得簡化后的數據集。再分類規則表示決策樹下的數據集,并在規則知識庫儲存下來。倘若有必要處理新數據樣本,還應按某種規則算法了深入匹配識別,得到綜合評價,從而管理好數據。
3.3 在數據整理上的應用
在整理數據時,數據源內部一般會交叉數據內容,因此應根據互動性,來分類整理觀測數據。針對原始數據當中存在的噪聲、冗余或者缺失的數據等,還應清洗、解析、重構這些數據,并且適當填補數據,以增大待挖掘數據的價值。通過分類后,主要涉及結構化、半結構化數據、非結構化信息。針對結構化數據,應適當過濾數據,及時剔除無效成分,以更加高效地分析;針對半結構化數據、非結構化數據,就應根據一定的標準,妥善加以處理,形成索引或機器語言。譬如,針對用戶評論、系統運行資料等,就先應轉換成為模糊或者加權邏輯,再向標準值,映射不一樣的詞語,來統一規范語言。
3.4 在數據分析上的應用
通過處理后的數據,可利用聯機處理專業技術,來支持決策過程,進而轉化數據信息,形成可輔助決策的有用信息。因為電力企業往往要求數據具有較高的實時性,所以針對電力數據,應注意分類處理,形成實時性與非實時性這兩種數據。就非實時性類型的數據,可利用分布式系統、MapReduce云計算來有效加以處理,或通過Hadoop云計算平臺,來有效處理數據。針對諸如電力負荷等實時性數據,電力企業可考慮借助內存計算專業技術,來經由內存運行計算所有數據,以加快計算進程;又或可以考慮在云平臺前,統一設置前置機,以接收實時性數據。
3.5 可視化電力企業目標
在電力企業,通過營銷決策體系,借助可視化數據設計,可以通過圖形來顯示數據中存在的復雜信息,進而可視化數據挖掘得來的成果,并且在電力企業規劃設計后續發展時加以靈活運用。通過可視化挖掘深度的數據,可迫使員工充分認知電力企業后續的發展趨勢、準確評價決策的正確性。最終結果與實際的符合程度,是挖掘系統成功與否的決定因素。
4 應用前景展望
4.1 個性化營銷
從大量的數據信息中,借助數據挖掘專業技術,準確提取用戶的基礎屬性、行為規則,再繪制出用戶畫像。基于此,電力企業便能夠劃分好消費群體,并從各種消費群體的基礎特性出發,給予個性化的營銷服務。另外,通過用戶畫像,還能幫助使電力企業全方位地了解關鍵性用戶的日常行為規則、用電習慣等,從而為這些重要用戶制定服務方略提供必要的依據,以提升服務于關鍵性用戶的質量水平。
4.2 客戶關系維護
伴隨電力行業的飛快發展,電力企業也逐步以服務質量成為市場競爭的核心。眾所周知,各用戶日常的用電習慣、需求等往往不盡一樣。所以,電力企業面臨海量的電力用戶,應注意緊抓用戶需求特點,提供更優質的服務,才能贏得更好地發展。借助數據挖掘專業技術,管理客戶、用電、檢修等方面的信息,能夠在同類別中,納入用電需求一樣的用戶。再基于此,向這些類別一樣的用戶,定制有針對性的服務,再投放必要的廣告,令客戶更加滿意、忠誠。
4.3 智能化電網
智能指的是可以深入分析材料、數據,得到系統、全面的理論知識,來妥善處理特定的問題,進而踐行商業戰略方面的目標。電力行業的智能,指的就是進一步合理化發電、供電、用電的結構系統、深入優化運行程序、增強綜合功效等,而形成的一個智慧系統,也就是智能電網。通過同步傳輸數據、能源,智能電網深度融合能源和信息專業技術后,現已逐步形成一個能源、數據下的可靠、友好、環保型的能源分析管理網絡。在融合大數據和國家電網的過程中,往往囊括自發電一直至用戶的能源轉換全程及輸送電力的整個鏈條。伴隨智能電網的飛快進步,通信和信息專業技術也越來越快地融合電網生產、管理與經營。這個信息通信體系現已變成智能電網當中的“中樞神經”,并且支撐著電網生產、經營、管理向前不斷發展。在大力行業,整體結構越科學,內部越少摩擦,相應的系統功效也就越大,智慧水平也就越高。當人們和數據進行互動時,就會更便捷地分析匯總,更好地大力支持決策。在新世紀下,我國電網企業現已初步搭建起國際領先、一流水平的集成信息平臺。在普及智能電表后,國家電網也從時效性上,深入豐富、拓展了業務數據。基于廣泛覆蓋的家庭、企業的數據,在網絡上的深度挖掘,可深化智能用電控制管理,為用戶提供實時的用電數據信息、在線共享能耗信息,達到高效循環使用能源的目標,從而有效促進節能減排。所以,智能電網的進一步發展,有助于數據挖掘專業技術推廣應用到電力行業。
4.4 創建信息系統
數據資料處理方面,計算機、網絡等技術往往更加便捷、高效。所以,為了跟上時代發展的趨勢,電力企業也都積極創建信息系統,來統計、分析內外部系統數據,來進一步簡化統計用戶資料的操作。同時,針對現代化的電力企業,還要注意及時摒棄“圍繞產品”的落后管理模式,逐步面向“社會-網民-電力單位”,創新實施“圍繞服務”展開的新型“企業網絡結構系統”下的管理模式。所以,部分電力企業紛紛開展了新型服務,如網上辦電、咨詢業務等,并分析、利用了其中產生的信息,而且獲益匪淺。在供電企業中,倘若應用這個模型,便能在自組織實時動態監測下,形成一個科學的監測模型,以有效預警、及時妥善處理高峰用電期的問題。在電力企業逐步完善信息系統中,借助數據挖掘專業技術定能達到事半功倍的目標。
4.5 能源消耗降低
當電力企業提取用戶信息、準確預測負荷、維護管理數據庫時,常常需要連續不斷地擴大數據中心的實際存儲規模。所以,在大數據時代下,高能源消耗、高投入現已逐步變成制約進一步展開數據挖掘的關鍵性瓶頸之一。據有關能耗問題的報道,從Google上看,數據中心的電量消耗3MW左右/年。但其中僅僅科學、合理地利用了6%~12%。從國內電力企業上看,大部分電能服務器其實常常位處閑置態,主要用于處理負荷高峰等方面的情況。所以,作為現代化的電力企業,需要從大量引進低功耗新型硬件、綠色可再生能源,來統一創建一個數據庫等,得以有效緩解當前嚴重的能耗。在時間序列基礎下,預測相似性電價等時,積極再利用節約得到的能源,進而從新的渠道上,另辟數據挖掘途徑。
5 結語
總之,通過應用數據挖掘專業技術來處理電力大數據信息,發揮出了越來越顯著的作用。所以,作為電力企業,應積極分析自身的大數據現狀,靈活運用數據挖掘專業技術,來大幅提升服務質量、贏得可持續發展。
參考文獻
[1] 肖明.大數據時代下數據挖掘技術在企業中的應用[J].中國管理信息化,2015,18(2):58.
[2] 許凡,孫勤紅.大數據時代的數據挖掘技術探討[J].電子技術與軟件工程,2015(16):208.
[3] 盧建昌,樊圍國.大數據時代下數據挖掘技術在電力企業中的應用[J].廣東電力,2014(9):88-94.