謝鵬 梁睿 張曉豐
摘要:近年來隨著國家通信網(wǎng)絡(luò)以及電網(wǎng)建設(shè)的發(fā)展便利,用戶數(shù)據(jù)也逐漸呈現(xiàn)上升趨勢,并且其復(fù)雜度越來越高,構(gòu)成龐大的數(shù)據(jù)庫,目前現(xiàn)有的數(shù)據(jù)分析模式無法滿足當(dāng)前電力用戶側(cè)大數(shù)據(jù)分析,因此有關(guān)部門急需解決目前大數(shù)據(jù)分析和電力數(shù)據(jù)處理面臨的問題。在本研究中通過進行電力數(shù)據(jù)分析以及并行負荷相關(guān)研究進行深入分析,希望能夠?qū)鴥?nèi)電力用戶側(cè)大數(shù)據(jù)分析提供參考經(jīng)驗。
關(guān)鍵字:電力用戶;側(cè)大數(shù)據(jù);分析;并行負荷;預(yù)測
近年來隨著我國人口和經(jīng)濟建設(shè)的發(fā)展,對于國內(nèi)電力用戶大數(shù)據(jù)來源以及側(cè)數(shù)據(jù)量,數(shù)據(jù)種類相關(guān)研究表明,在電力數(shù)據(jù)儲存方面存在很大問題,而且在數(shù)據(jù)處理和可用性方面還面臨較多挑戰(zhàn),基于大數(shù)據(jù)背景下云計算技術(shù)支持的數(shù)據(jù)分析平臺實際上是利用多種傳感器進行電力用戶側(cè)大數(shù)據(jù)分析,并提出一些有效方法,將這些方法進行優(yōu)化處理能夠為國內(nèi)電力用戶側(cè)大數(shù)據(jù)分析提供幫助。
1電力用戶側(cè)大數(shù)據(jù)
數(shù)據(jù)量大。針對目前社會存在的廣泛問題是電力用戶測大數(shù)據(jù)分析儲存面臨極大挑戰(zhàn),由于側(cè)大數(shù)據(jù)本身容量大,比如對于某地區(qū)擁有1萬套傳感器終端設(shè)備進行計算時發(fā)現(xiàn),每套終端每隔5分鐘會進行數(shù)據(jù)采集,每個月將產(chǎn)生較大的數(shù)據(jù)量,每年形成的數(shù)據(jù)量將無法計算。近年來隨著電網(wǎng)智能化程度的加深,為確保實現(xiàn)數(shù)據(jù)精細化處理,能夠有效控制數(shù)據(jù),且數(shù)據(jù)維度也拓展了幾百倍,同時數(shù)據(jù)產(chǎn)生的影響是比較大的電力負荷因素,采集頻率種類顯著提升。基于這種情況下電力公司還需要對過往的數(shù)據(jù)儲存能夠完成數(shù)據(jù)復(fù)雜分析,以滿足當(dāng)前電力用戶實際需求。
數(shù)據(jù)類型較多。隨著科學(xué)技術(shù)的發(fā)展多種傳感器的應(yīng)用性拓廣,日常所收集的數(shù)據(jù)包含結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),對于一些非結(jié)構(gòu)化數(shù)據(jù)需要由電力公司進行收集,而這些數(shù)據(jù)在傳輸采集儲存時會形成多元化數(shù)據(jù),這對于構(gòu)建用戶增大數(shù)據(jù)是十分重要的。由于這些數(shù)據(jù)具有多種類型,導(dǎo)致大數(shù)據(jù)庫負荷更加嚴(yán)重,數(shù)據(jù)處理問題和準(zhǔn)確化受到了極大挑戰(zhàn),除存在較多類型的數(shù)據(jù)之外,數(shù)據(jù)本身也會快速產(chǎn)生,每秒鐘采集的數(shù)據(jù)是比較多的,每次采集頻率提升也會給數(shù)據(jù)庫帶來指數(shù)變化。從一定程度上來看,科學(xué)技術(shù)的發(fā)展以及數(shù)據(jù)庫數(shù)據(jù)采集速度的提升會給數(shù)據(jù)庫負荷帶來嚴(yán)重壓力。比如電力公司會針對智能電表進行數(shù)據(jù)采集,其采集頻率由過去的15秒變?yōu)?秒,其數(shù)據(jù)采集及頻率顯著提升,所采集的數(shù)據(jù)逐漸增加,需要對數(shù)據(jù)完成實時采集,在設(shè)計時由于數(shù)據(jù)類型較多所產(chǎn)生的類型也不斷發(fā)生變化,這對于數(shù)字化來說面臨極大挑戰(zhàn)。在電力系統(tǒng)應(yīng)用過程中,電力公司需要對龐大數(shù)據(jù)進行有效分析,能夠?qū)^往產(chǎn)生的海量數(shù)據(jù)完成及時處理,要求構(gòu)建大數(shù)據(jù)平臺并實現(xiàn)并行化處理,減輕數(shù)據(jù)庫負荷壓力,能夠為電力用戶獲得較為準(zhǔn)確和且有價值的數(shù)據(jù)。
數(shù)據(jù)交互性。從目前科學(xué)技術(shù)角度來看,智能電網(wǎng)具有交互性特點,其交互性主要包括與用戶交互性,與電力相關(guān)行業(yè)的數(shù)據(jù)交互,智能用電交互,這對于數(shù)據(jù)挖掘分析是十分重要的,可將所收集到的氣象、民生數(shù)據(jù)進行融合,從一定程度上能夠使電力符合時間預(yù)測。目前可解決大數(shù)據(jù)平臺的數(shù)據(jù)支持及云計算,該技術(shù)在大數(shù)據(jù)管理中是一種核心技術(shù),同時能夠?qū)?shù)據(jù)完成并行計算處理,包括分布式文件,并行編程框架等,該技術(shù)具有較強功能,具有一定的可靠性,拓展性,已經(jīng)實現(xiàn)了在電力行業(yè)中也針對該技術(shù)進行深入研究,目前研究成果主要集中于系統(tǒng)框架設(shè)計,這對于系統(tǒng)儲存模型設(shè)計來說也發(fā)生了較大程度的變化。
2電力用戶側(cè)大數(shù)據(jù)的發(fā)展分析
大數(shù)據(jù)整合。從一定程度上來看,大數(shù)據(jù)整合是電力用戶側(cè)大數(shù)據(jù)發(fā)展的主要趨勢,近年來隨著國內(nèi)電網(wǎng)廣泛應(yīng)用智能電表,以及傳感器、網(wǎng)絡(luò)、物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,導(dǎo)致大數(shù)據(jù)模式出現(xiàn)較大變化,每個單位數(shù)據(jù)也存在口徑不一的問題,這對于大數(shù)據(jù)整合加工是十分困難的。針對目前海量數(shù)據(jù)利用這些數(shù)據(jù)創(chuàng)造有效模型,完成大數(shù)據(jù)規(guī)范表達,基于模型實現(xiàn)大數(shù)據(jù)融合,對于國內(nèi)電力用戶特大數(shù)據(jù)發(fā)展是十分重要的,電力用戶側(cè)大數(shù)據(jù)需要具備一定的可用性,由于數(shù)據(jù)采集方法較多,因此不同通道質(zhì)量及大小不同對于大數(shù)據(jù)可用性不僅需要進行接收數(shù)據(jù)質(zhì)量處理,同時還需要提升數(shù)據(jù)管控能力,在實際運行過程中需要將低劣質(zhì)量的數(shù)據(jù)刪除,并進一步精確分析一些具有價值的數(shù)據(jù),能夠通過數(shù)據(jù)分析及時為有關(guān)部門提出決策依據(jù)。可以說大數(shù)據(jù)整合是一個數(shù)據(jù)分析較為完整的過程,能夠使信息社會獲得更好的發(fā)展。
數(shù)據(jù)儲存分析。目前國內(nèi)已經(jīng)實現(xiàn)了針對1.5億用戶進行信息采集工作,從一定程度上也使國內(nèi)電力數(shù)據(jù)形成大規(guī)模體系,在多個省市投資使用電動汽車換電站、充電樁等設(shè)備,這些數(shù)據(jù)儲存要求是比較高的,其儲存模式時間快速增長對于數(shù)據(jù)庫性能提出較高要求,針對復(fù)雜數(shù)據(jù)傳統(tǒng)關(guān)系型數(shù)據(jù)庫無法滿足精準(zhǔn)儲存和數(shù)據(jù)分析要求,因此需要尋找更加完善的數(shù)據(jù)分析模式,進而能夠?qū)@些龐大數(shù)據(jù)量進行有效儲存分析,互聯(lián)網(wǎng)交互性能夠從一定程度上決定用戶側(cè)大數(shù)據(jù)分析過程中的準(zhǔn)確性,實時性分析,急需利用大數(shù)據(jù)工作進一步來支持互聯(lián)網(wǎng)的推進速度。
可以利用隨機森林法利用隨機子空間理論進行計算分析,在隨機森林中不同分類回歸樹可以在樣本集中表現(xiàn)特異性質(zhì)差異,如果總樣本為s,則不同分類樣本為ts,其次隨機森林結(jié)果為不同分類回歸式投票選擇結(jié)果或平均結(jié)果。具體如下所示。

該方法并行化是依據(jù)隨機子空間這種方式可體現(xiàn)相互獨立構(gòu)建,能夠為并行化提供基礎(chǔ)。隨機子空間是每個節(jié)點的屬性測試,采用抽簽法從樣本抽取多種屬性測試,從一定程度上可避免數(shù)據(jù)一次讀入過度擬合的問題產(chǎn)生。
小結(jié)
總而言之,在本研究中針對電力用戶側(cè)大數(shù)據(jù)數(shù)據(jù)庫進行深入分析,能夠針對當(dāng)前國內(nèi)電力用戶側(cè)大數(shù)據(jù)實際發(fā)展情況進行探討,通過分析用戶側(cè)大數(shù)據(jù)庫特點,進一步說明了基于數(shù)據(jù)分析平臺開展數(shù)據(jù)實時收集、分析處理、挖掘的重要性。
參考文獻
[1]王鴻璽, 李飛, 李翀, et al. 基于大數(shù)據(jù)分析的混沌神經(jīng)網(wǎng)絡(luò)模型在負荷預(yù)測中的應(yīng)用[J]. 貴州電力技術(shù), 2017, 20(8):1-5.
[2]龍鑫. 基于Spark和Holt-Winters模型的短期負荷預(yù)測方法[D]. ?2017.