杜秀
摘要:隨著科學技術的不斷進步,電網的智能化水平也越來越高,也因此在電網運行和設備監測的過程中產生了大量的數據,例如系統運行數據、設備狀態數據、用戶需求數據等等。另外,物聯網技術和云計算的蓬勃發展,也進一步增強了電網數據的體量和復雜度。如此龐大的數據體系難免會帶來一些數據質量問題,如數據缺失、數據冗余、數據異常等。數據質量的好壞不僅關乎電網應用分析的可靠性與正確性,還會對電力系統的穩定運行產生影響。所以,進行高效可靠的數據質量管理對電力系統具有重要意義。本文基于數據挖掘技術在電網安全生產風險管控中的應用研究展開論述。
關鍵詞:數據挖掘技術;電網安全生產;風險管控;應用研究
引言
電力行業在大數據時代也面臨著新的挑戰和難得的發展機遇。應用大數據挖掘和分析可以極大彌補現有的人工處理數據的不足,提高電網運營監控的輔助決策水平和工作效率與質量,將重點放在檢查關注各項生產任務計劃產生異常預警的原因上,全面管控各種生產經營風險,提高公司管理水平和運營效率。但以往國內外學者側重于電網運營監測體系的分析研究,采用大數據分析方法對安全生產風險智能管控的研究較少。
1技術應用方式
近年來,數據挖掘技術由于其很強的技術優越性,已經成為一種各領域廣泛使用的先進技術,尤其是在電力系統中,數據挖掘技術可以對電網的數據進行優化處理,從而達到提高電網運行效率的目的。另外,電網管理者還可以通過使用數據挖掘技術對人員績效考核、保護功耗記錄在內的多項日常工作進行應用,以提高數據應用程序的準確性,經過各種挖掘算法的研究,可以有效地分析數據之間的隱式關系。在這一過程中采用數據挖掘技術的優勢顯而易見,同時也可以為下一步發電量預測、負荷預測等提供更為可靠的技術支持。神經網絡作為一種廣泛使用的人工智能研究方法,在我國已得到廣泛應用。電力調度自動化系統的數據挖掘技術具有自我處理、數據分發以及高容錯性等優越性,使得神經網絡數據挖掘方法更適合處理電力調度自動化系統數據。考慮到數據挖掘技術本身存在固有的數據誤差和不準確性,電網調度人員在進行調度自動化系統數據挖掘過程中應當充分考慮到電能分配的實際需要,并在此基礎上不斷改進數據邏輯的處理方法。電網調度人員首先應做好數據集成管理工作,這是因為電力調度自動化系統需要處理海量的電網運行數據,這些數據具有復雜性和多樣性。此外,技術人員通過應用神經網絡數據挖掘方法,可以對電網各種運行方式、典型區域電網的運行狀態、每條線路的連接方式和每個變電站的設備參數等信息進行合理地挖掘和排序,同時保證相關數據信息綜合應用,進而可以實現電網運行的綜合分析和決策。另外,技術人員可以結合神經網絡收集的電網數據,進行更高效率的分析、決策和數據交換。
2安全生產業務相關數據模型
數據模型包括數據結構和數據約束條件。數據結構是數據模型的基礎,它描述了數據的類型、性質、內容以及數據間的聯系等。數據約束建立在數據結構基礎上,指的是數據結構內數據間的語法、制約和依存關系,以及數據動態變化的規則,以保證數據的正確和完整有效。運營監控業務數據模型是為了對變電巡視核查、輸電巡視核查、配網巡視核查、保供電核查等業務數據存儲建立的數據模型,不同業務數據模型需要在一個統一的規范下建立,以便于不同業務模型之間的信息交換和共享。安全生產業務數據模型建立的步驟分為獲取業務數據、數據整理、數據存儲、數據分析與信息交付等五層。
3數據挖掘系統
對于一個完整的數據挖掘系統,其主要由數據庫、知識庫、數據庫服務器、數據挖掘引擎、挖掘算法及人機交互界面等模塊所構成,在該系統組成中,數據(倉)庫主要是通過數據庫軟件實現對源數據的存儲。另外,還包括數據在清理、集成、過濾過程中的中間數據。在功能上,數據庫是面向事務的設計,一般用來存儲系統運行的實時數據;數據倉庫則是面向主題的設計,一般存儲歷史數據。從數據量的角度上,數據倉庫的數據量遠大于數據庫。數據庫服務器與數據倉庫服務器由局域網中的1臺或多臺計算機所構成,主要是為底層的數據庫或數據庫群提供一個向上的數據接口,使得上層的應用程序能夠適時調用數據庫中的數據。知識庫主要用來放置數據挖掘過程中所用到的專業領域知識與規則。同時,技術人員的經驗和常識也可以包括在內,用于輔助指導搜索。數據挖掘引擎是系統中的核心組成,能夠利用知識庫與使用者實現互動。一般由不同功能的模塊所構成,用于聚類分析、特征化、及偏差分析等。模式評估利用興趣度作為標準,從而可以挖掘出代表知識的真正有趣模式。人機交互用來實現使用者與數據挖掘系統之間的通信,可以使用戶利用可視化界面制定數據挖掘查詢或任務計劃。同時,該部分還允許用戶瀏覽數據庫、數據倉庫和數據結構,了解系統狀態。
4電力統計數據問題
隨著電網體系規模的不斷擴大,其運行過程中產生的數據量也越來越豐富,這其中蘊含著大量的信息,是可以影響發電、輸配電、用戶用電管理的決策指標的基礎。但由于設備故障、認為原因等,電力數據可能會存在一些誤差甚至是錯誤,這不僅不能為電力系統提供可靠的數據分析基礎,而且可能因此帶來決策錯誤,影響整個系統的良好運行。1)格式錯誤。所獲取的數據格式應是統一的,不滿足格式的數據組應視為不合格。另外在數據傳送過程中,可能會出現亂碼等錯誤,這也是格式檢查的重要方向。2)精度錯誤。在數據獲取和傳輸過程中,所有數據的精度都應保持一致,精度與規定不一致的數據應為不合格3)數據越限。每個數據都有自身約束范圍,數據應在規定范圍內。4)數據冗余。數據傳輸過程中可能存在重復記錄的問題,因此會產生數據冗余。5)數據缺失。在數據獲取和用戶訪問端,所獲取的數據量應一致,不能存在缺失記錄或缺失字段。6)合理性問題。所獲取數據都應滿足電力系統運行要求,各數據之間互相約束,數據段不滿足運行條件的為不合格數據段。
結束語
配合K-means算法能更好地適應大容量、多維度文本數據的處理,同時簡化了計算流程,一定程度上提高了計算的速度與效果。在此基礎上結合多種異常檢測算法和合適的文本數據規范化法完成了安全生產風險管控智能分析追蹤軟件的開發。通過本套系統對區局以及現場的生產計劃落實情況開展即時快速的智能分析與快速核查追蹤,使得公司可以對異動的每一個生產活動、每一個計劃、每一個節點的數據開展全天候快速管控,及時發現異常和預警,對生產風險進行全面管控和分析,保障電網安全經濟運行。
參考文獻
[1]薛飛.電網安全穩定特性分析的調度運行大數據挖掘技術研究[J].寧夏電力,2019(01):2.
[2]盧穎浩.數據挖掘在電網安全生產監督管理中的應用研究[D].華北電力大學,2018.
[3]莫琦,李矛,李翔,付龍明,王立娜,盧穎浩.數據挖掘技術在電網安全檢查管理中的應用[J].科技創新導報,2017,14(19):209-210+212.
[4]李翔,莫琦,付龍明,王立娜,盧穎浩.基于數據挖掘的電網隱患等級自動評估方法[J].科技創新導報,2017,14(17):99-100.