, (國網四川電力公司宜賓供電公司,四川 宜賓 644000)
大數據的概念:對海量種類、來源復雜的數據進行快速采集、發現與分析,用經濟的方法發掘數據的價值體系、技術架構[1]。大數據不僅指海量數據,而且還囊括了研究這些數據的方法、理論及技術。電力系統是大數據應用的重要范疇[2]。由于智能電網的飛速發展,電力系統產生了大量結構多元化、來源復雜的電力數據,這些數據具有巨大的潛在利用價值,可提升電網管理、運行水平,甚至產生歷史性變革。
近幾年,國內外逐步興起大數據技術在配電網中的應用研究。2013年美國EPRI啟動了兩項大數據項目,其一就是配電網現代化示范(distribution,modernization,demonstration,DMD)[3];美國加州大學等機構對洛杉磯電力數據進行研究,將街占地面積、區建設時間以及平均收入等數據全部整合在一起,以地圖的形式展現了2011年1月至2012年6月各街區各月平均耗電量[4];法國電力公司(EDF)研發了以大數據為基礎的用電采集系統,該系統主要是以電表數據為主,再結合氣象數據、用電合同信息、電網數據等構成大數據的數據來源[5]。
中國也對智能配電網大數據技術與應用進行了研究,華北電力大學對用戶側大數據分析與并行負荷預測進行了研究[6];江蘇省電力公司從2013年開始建立營銷大數據智能分析系統,該系統目前已囊括了電壓等級、氣象、行業等9個維度的數據分析模型和多項關聯性分析模型,多視角解析整個省的電力用戶數據[7]。
下面首先給出了電力大數據基本概念,然后對大數據技術在電力系統中的運用進行分析,并設計了一種中壓供電可靠性管理系統。該系統對導入的OMS大數據進行清洗、篩選、分類后,可以分別得到該地區城網、農網的供電可靠率;可給出該地區的重復停電情況(包括線路重復停電、臺區重復停電);對計劃停電進行分析;提供搶配效率、故障停電與計劃停電損失預估等優質服務。本系統的分析結果可給運行人員提供一定的參考,實地核實停電多發臺區的情況,以減少停電次數,提高中壓供電可靠性。
隨著電力信息化的發展,電力數據規模迅速擴大,種類也快速增加,這些各種各樣的數據組成了智能電網大數據庫。
根據數據來源,電網大數據可以分為兩大類[8-9]:電網內部數據、外部數據。內部數據來自用電信息采集系統(collection system information,CIS)、營銷系統、廣域監測系統(wide area measurement system, WAMS)、配電管理系統、生產管理系統(production management system,PMS)、能量管理系統(energy management system,EMS)。外部數據主要來自地理信息系統(geographic information system,GIS)、電動汽車充換電系統、公共辦事部門、網絡等。
這些數據相互影響、關聯,關系復雜。例如社會經濟發展狀況影響著用戶用電情況,用戶用電狀況又影響著電力交易情況。總結各界對數據特征的定義,再結合智能電網電力數據的特征,將智能電網電力大數據特點總結成以下幾點:1)數據的來源是各個分散安置、分布管理的系統;2)數據數量多、維度高、類型繁多;3)對電力公司、電力用戶以及社會經濟發展有重要的作用;4)數據間潛在的關系錯綜復雜,可對其進行挖掘,大部分情況下有實時性要求。
數據挖掘(data mining)指從海量的數據資料中獲取潛在有用的并且最終可理解的信息與知識的過程[10,13]。從數據挖掘的功能出發可分為如下幾類:
1)關聯分析:關聯分析是為了找出數據中潛在的關系網,通過關聯分析可得到較多的關聯規則,通過設置合適的“可信度”、“支持度”閾值刪除一些多余的關聯規則來獲取有用的規則。
2)數據分類:根據特征性描述、區別性描述對數據進行分類,特征性描述是針對同類數據的共性進行描繪;區別性描述是對兩個及以上類別之間區別的描述。
3)聚類分析:將定量數據按照相似程度劃分為不同類的過程,劃分為同一類的樣本數據具有較大的相似性,不同類的樣本之間則表現出較明顯的差異性。
4)趨勢分析:即時間序列分析,從數據隨時間變化過程中發現規律、趨勢。趨勢分析與關聯性分析相同,都是為了發掘數據內潛在的聯系,但趨勢分析主要是研究數據的前因后果關系。
5)偏差檢測:從海量數據庫中檢測出明顯異常的偏差數據有重要意義。通過檢查發現這些異常,并從數據庫中將其剔除,可提高數據庫使用價值。
6)數據預測:通過對歷史數據的建模分析,結合當前的數據,運用所建數學模型實現對數據的未來變化趨勢的預測。
數據挖掘的過程涉及到數據統計、數據庫存儲、人工智能和機器學習等領域,通常情況下,數據挖掘的過程包括如下幾個步驟[11-12]:
1)異常數據清除:剔除噪聲數據和不一致的數據。
2)數據集成:將不同類型的數據組合在一起。
3)數據選擇:從大數據中篩選與任務相關的數據。
4)數據變換:將數據變換為適合發掘分析的數據模式。
5)數據挖掘:從統一后的數據結構中發掘出相應的數學模型。
6)信息表示:用簡潔的方式顯示發掘出的信息。
7)規則驗證:用其他數據驗證數據挖掘結果的精確度。
該流程中前4步是對數據進行預處理,是信息挖掘的關鍵階段,直接影響數據挖掘的效果。在這個階段中可采用多種方法處理,剔除錯誤、虛假的數據,得到有用信息;然后運用數據挖掘技術從中發掘出潛在的關聯規則,并用簡單、可視化的方式對知識進行表達。
基于前述技術開發了一種基于大數據的中壓供電可靠性分析管理系統。
該系統分為4層:數據資源層、處理層、公共服務層、業務應用層。系統組成結構如圖1所示。

圖1 中壓供電可靠性管理系統結構
1)數據資源層:通過在PMS系統、OMS系統、Open3000、用電采集系統等系統中,導出其源數據,將源數據載入到系統中,在載入時,系統會根據數據清洗算法,對數據進行清洗,排除異常數據,提高準確性。
2)數據處理層:數據處理層集成了數據挖掘算法,有分布式內計算、流計算、交互式計算、圖計算、高性能計算。通過處理后將結果反饋給下一層。
3)公共服務層:公共服務層是從技術方面為業務層的功能提供服務,包括可視化管理、事件管理和、報表分析等。
4)業務應用層:主要包括數據的不同功能展示,如節電、用電預測、網架優化、錯峰調度結果等功能均通過該層輸出所需結果。
所設計系統經用采系統獲取數據,由于國家電網公司的用采數據中存在很多問題,比如采集器故障、周期性故障、網絡傳輸故障等,所以在進行分析之前需要對數據進行清洗。根據大數據算法對臺區停電情況進行分析、研判,確保停電數據的真實性與可靠性。再根據不同維度(如地區、線路、臺區、時段等)對數據進行分表展示,使用戶能夠自定義分析維度,進行自主分析。
隨著市場經濟的迅速發展,用戶對供電質量的要求越來越高,供電可靠性已成為電力企業衡量的因素之一。供電可靠率是指統計周期內配電網絡對用戶有效供電總小時數與統計周期內總小時數之比。
(1)
式中:σ為用戶平均停電時間;τ為統計時間。
從式(1)可知要提高供電可靠率,實質上就是要降低統計周期內用戶的總停電時間。這可以從降低故障停電次數、降低停電重復率以及降低停電戶數來幫助解決該問題。
當前的停電管理系統中,所有的停電都是一線班組收稿操作,這加大了工作人員壓力,數據準確性也有待進一步提高,所以需要一種可以自動記錄和分析停送電研判的算法對停送電進行管理;在精確記錄臺區內停電情況的同時,盡可能減少一線工作人員的工作量,提高自動化業務管理水平。
所設計系統的停電研判方案是根據電力用戶采集系統、OMS系統、PMS系統、變電站10 kV線路總表等數據對停電的可信度進行分析研判,以提高停電研判的正確度。
對系統中輸入的某地區數據進行處理,選擇展示日期,通過分析篩選,對該地區停電的可信度進行分析研判,輸出的結果如圖2所示。從該地區2017年前7個月供電可靠率的變化趨勢可見6月份該地區供電可靠率稍有降低。從停電平均時戶數也可知6月份停電戶數最多;該地區總停電548次,平均供電可靠率高達99.91%。
如今在電網運行分析中還沒有開展有效的重復停電管理分析,本系統主要幫助企業實現:
1)量化統計分析臺區、線路重復停電問題;
2)提升企業全面掌控臺區重復停電的能力。
本系統利用大數據監測方案。以電力系統的大量運行數據為基礎,總過程可分為大數據采集、清洗、監測分析、閉環跟蹤等環節。對臺區重復停電情況進行量化、歸集分析。實現框圖如圖3所示。

圖2 某市城網供電可靠性分析

圖3 停電管理系統
在處理數據時,對每條停電數據設置可信度百分比,從而能靈活識別臺區停電情況。模型主要考慮如下幾個因素:
1)自動計算監測周期內電壓和電流曲線子表中相應記載的數據,如果所記載點數百分比大于等于90%,則認為此臺區的總表運行正常;
2)停電時間高于1 h的臺區在該停電時間內是否有數據記載,如果有,則說明地區停電的可靠性較低;
3)停電之前以及恢復供電后2 h內是否有電壓、電流記錄,如果有則認為臺區停電比較可信。
基于以上3個因素的數據計算模型可以提升臺區供電可靠率的可靠性。
3.3.1 線路重復停電分析
對某市的重復停電情況進行分析,設置展示時間段為2016年1月至2017年11月,對某地區各個城市的線路重復率進行展示,結果如圖4所示。據圖4(a)可知在數據統計期間該地區總停電590次,停電總時長為1 690.17 h。據圖4(b)可知重復停電2次的有16條線路、3次的有20條線路、4次的有23條線路、5次的有13條、6次的有9條、7次及以上的有23條線路。發生重復停電的系數高達104條,可見該地區線路重復停電現象比較嚴重。可進一步核實,調查原因,加大治理力度,減少線路重復停電次數。

圖4 某市線路重復停電次數分布
3.3.2 臺區重復停電分析
對該地區各個區域臺區的重復停電情況進行分析。定義展示時間范圍同上,統計區域在定義時間范圍內停電、重復停電的次數和時長。統計各個區域在定義時間內臺區重復停電的次數分布情況如圖5所示。
據圖5(a)可知,該地區各市各臺區總停電次數為7 728次,停電時長為42 700 h。其中B縣臺區停電次數最多。據圖5(b)可知,停電2次的臺區有961個、3次的有252個、4次的有8個、4次的有3個、大于5次的基本沒有。臺區重復停電情況比線路重復停電稍好。出現2至3次重復停電的臺區居多。
停電類型分為:計劃停電、故障停電、臨時停電。其中故障停電、臨時停電均屬于非計劃停電。
根據大數據處理,對該市計劃停電數據進行分析,對該市2016年5月的計劃停電情況進行展示,結果如圖6。據圖6(a)可知,C、D縣供電公司的計劃停電次數較多。對該地區全年計劃停電中重復停電線路進行分析,如圖6(b)共有67條線路發生重復停電,其中7次及以上的線路占比最高,與前面分析的總線路重復停電次數相比,計劃停電中的線路重復停電次數大大減小,可見重復停電次數大部分由非計劃停電引起。

另外所設計系統還對該市計劃停電的時段進行了統計,結果如圖6(c)所示,該圖表明計劃停電時間段大部分集中在7:00至18:00,這應該是從人民的安全、方便性上考慮到晚上的用電需求比白天更大。
3.5.1 配搶效率分析
所設計系統可對配電搶修效率進行詳細分析和展示,如圖7所示。數據統計起始時間為2017年1月1日至2017年10月24日,總體上停電延時比供電延時次數多,并且停電延時的時長大于6 h的次數最多。
從檢修類型統計圓餅圖可知,計劃檢修占比最高,故障檢修占比相對較小,但是仍然說明有一定數目的故障發生。該圖在幫助運行人員了解檢修情況的同時,提醒檢修方關注故障檢修、非計劃檢修等情況,對故障線路進行考察,減少故障發生概率。
3.5.2 停電經濟損失預估
供電可靠性降低不僅對用戶造成極大損失,也會對電力公司造成損失,所以系統針對于臺區重復停電的情況,對每個時間段內重復停電對電力公司造成的損失進行了預測、計算。通過臺區停電事件對臺區96個點進行數據擬合,計算出臺區每個時間點的負載預測,對臺區反復停電損失進行合理估算。結果如圖8所示(圖中是某公司某周的停電損失金額,損失金額為90.56萬元)。



圖6 某市各縣計劃停電分布情況

圖7 配搶效率分析情況

圖8 損失金額估算
在安排停電時,電力公司需要對停電的損失進行評估,所以系統提供給了電力企業一個科學、量化的評估依據。如圖9所示,通過用戶選擇線路、停電時間段,通過后臺大數據分析預測,得出停電損失額度。

圖9 計劃停電損失金額
研究開發了一套基于大數據的中壓供電可靠性管理系統,系統分析結果表明:
1)該系統通過后臺大數據分析預測,有效提高了臺區停電事件可信度,并可得出停電損失額度。
2)該系統的停電研判方案是根據電力用戶采集系統、OMS系統、PMS系統、變電站10 kV線路總表等數據對停電的可信度進行分析研判,提高了停電研判的正確度。
3)該系統處理可得到既定地區內的城網供電可靠性高達99.91%;可得到該地區線路重復停電情況、臺區重復停電情況;可實現對計劃停電分布情況的分析;可提供配搶效率分析、停電損失估計等優質服務。
系統分析結果可以為運行人員提供參考,對故障停電多發地區進行核實,采取相應措施以提高供電可靠率。
[1] 于海平. 基于數據挖掘技術的運營監控系統[J].電氣技術, 2016, 17(9):147-149.
[2] 張沛, 吳瀟雨, 和敬涵. 大數據技術在主動配電網中的應用綜述[J].電力建設, 2015, 36(1):52-59.
[3] 劉峰. 大數據分析在配電網統計數據中的應用探索[D].廣州:華南理工大學, 2016.
[4] 徐祥征, 王師奇, 吳百洪. 基于大數據分析的配電網主動檢修業務應用研究與實現[J].科技通報, 2017, 33(6):105-108.
[5] 杜明建. 大數據技術在負荷預測與負荷特性分析中的應用[D].南京:東南大學, 2015.
[6] 孫立華, 胡牧, 孟慶強,等. 配網線損大數據高性能計算解決方案[J].計算機與現代化, 2016(12):42-46.
[7] Qiu R,Antonik P.Big Data and Smart Grid:A Random Matrix[M].John Wiley and Sons,2014:33-60.
[8] 夏友斌, 俞鵬, 蘇志朋. 基于數據中心的配網故障研判方案[J].科技經濟導刊, 2016(7):39.
[9] Oracle Utilities.Utilities and Big Data:A Seismic Shift is Beginning[R].An Oracle Utilities White Paper.
[10] 張東霞, 苗新, 劉麗平,等. 智能電網大數據技術發展研究[J].中國電機工程學報, 2015(1):2-12.
[11] 康春紅, 謝育新. 供電可靠性實時計算及預控管理系統的開發與應用[J].廣西電力, 2011, 34(5):57-59.
[12] Wu Xindong,Zhu Xingquan,Wu Gongqing,et al.Datamining with Big Data[J].IEEE Transactions on Knowledg eand Data Engineering,2014,26(1):97-107.