曾麗君?劉玉璽


摘要:隨著新一代信息技術的不斷應用,電力數據量不斷增加,這些數據包含重要的電力價值信息。因此,對電力數據進行分析和利用有助于降低電力運營的風險。本文引入知識圖譜,建立了電力數據知識圖譜,分析了電力數據各實體的數據價值。并以電力故障停電事件為案例,探討了電力數據知識圖譜的應用場景和結果。研究表明,建立電力數據知識圖譜有助于壓縮電力運營成本,并推動電力業務流程的效率。
關鍵詞:電力數據;知識圖譜; 典型應用
電力能源對國家經濟和人們正常社會活動具有重要影響,為人們的經濟活動提供基本條件。電力數據作為電力業務運行的基本結果,具有重要的價值,能夠展現電力網絡、電力設備運行以及電力資源利用等狀態,是不可或缺的基本電力要素。因此,對電力數據的分析和處理以獲得電力價值是人們不斷研究和探索的重要方向。隨著時間的不斷積累,電力數據的收集和處理復雜度不斷增加。目前,電力數據的收集處理呈現零散化和局部化的趨勢,通常在各地數據中心進行處理和分析。然而,由于電力設備的網絡化覆蓋程度還未廣泛深入到偏遠地區,一些基礎數據存在丟失和遺漏情況,數據分析的地域性較強,可能影響決策的實施。隨著電力智能化終端的不斷升級,網絡化覆蓋程度日益提高,電力運行中的數據量也日益增加,數據的集中收集和處理難度不斷提高。因此,需要更高效地利用信息化手段,規范化和機構化地處理數據,以進一步提升電力數據的分析能力和價值。
知識圖譜在不斷發展中廣泛應用,能夠全面化、結構化地為數據處理提供手段。知識圖譜的關鍵要素主要包括實體、關系和屬性,能夠存儲各實體元素并相互關聯。在電力領域,學者們對知識圖譜的分析和應用進行了探索和應用。學者李冬在電力調控中加入知識圖譜進行分析,能夠為決策提供參考。學者沈文首次將電力圖譜的框架進行了研究和設計,標志著知識圖譜的發展進入了實用階段。另外,學者喬振將知識圖譜運用到電力故障監測中,并對故障數據分析做了應用嘗試,這也是知識圖譜的第一次實踐運用,對后續研究具有重要指導意義。
本文通過收集和分析電力相關的能耗數據以及電力經營數據,整合電力系統內的大數據,形成知識架構,進而提出電力數據知識圖譜的構建和驗證,并對電力數據知識圖譜進行應用的分析,以提高數據的處理和分析效率。這樣的應用有望為電力領域的決策和發展提供重要支持和指導。
一、基于電力數據知識圖譜構建相關技術
電力數據知識圖譜的構建需要從電力一、二類設備中采集基礎數據,并提取相應的知識,然后通過識別電力數據的能耗和經營數據信息,綜合形成對象的知識。利用這些知識進行分析和處理,自動識別數據的價值,并預測數據的趨勢。一般的流程包括以下幾個步驟。
(一)電力數據采集
電力數據采集是數據處理和分析的前提,是從電力一、二類設備中提取的一手數據。這些基本數據信息包括電力設備信息、經營數據信息、設備診斷信息、故障預警信息等。一旦獲得這些原始數據,就需要對其進行規范化處理,以形成電力原始數據集。
(二)知識數據的加工
對于電力數據采集的原始數據集,需要進行加工處理。加工的手段主要包括數據中的價值分析,即知識提取分析,以及數據的處理審核,也就是知識的處理過程。接著,有價值的數據需要進行分類和提取,最后進行數據的融合,并將融合后的知識加入知識圖譜中。這樣可以更好地整合、分析和利用電力數據,從而提供更多有價值的信息和見解。
(三)知識圖譜及價值服務
知識圖譜將采集到的有價值數據作為知識點進行表示,其模型使用實體、屬性、聯系等要素來描述。價值服務是從眾多知識數據中提供的一些與電力設備信息、經營數據信息、設備診斷信息,以及故障預警信息等緊密相關的知識服務。
二、電力數據知識圖譜搭建方法
電力數據知識圖譜的構建主要涉及流程層和數據層兩方面。流程層主要包括流程中的實體、屬性和關系,并對其進行描述的一種架構。數據層主要是采用高效的方法對數據進行實體的選擇和關系的確定。流程層和數據層之間相互關聯、相互聯系,共同構成了電力數據知識圖譜。
(一)流程層搭建
電力數據的價值分析主要關注電力設備信息、經營數據信息、設備診斷信息以及故障預警信息等。將本文電力數據分析分為以上四個部分,并對應分析每個部分的實體、關系和屬性,也就是實現流程層的搭建。詳細模塊實體聯系如下:
電力設備信息模塊:電力設備信息模塊的主要實體有設備讀數、設備溫度、設備運行時間、環境濕度等,對應的聯系有設備溫度影響設備讀數和設備運行時間,環境濕度影響設備讀數和設備運行時間。
經營數據信息:經營數據信息主要實體有基礎設施及維護成本、電量售價、使用電量、銷售利潤、經營指標等,對應的聯系有維護成本影響電量售價和銷售利潤,電量售價影響使用電量、銷售利潤和經營指標。
設備診斷信息:設備診斷主要是指電力設備檢修等的診斷,主要實體有電力設備運行狀態、電力設備上線時間,電力設備的精度,電力設備的損耗程度等,電力設備的上線時間、損耗程度影響著電力設備的精度和運行狀態。
故障預警信息:故障預警是設備的智能化研判結果,主要實體有故障類型、故障時間、故障等級、故障環節,故障維修成本等,故障類型,等級,環節影響故障的維修成本,故障發生時間影響故障的等級和維修成本等。
(二)數據層搭建
電力數據的數據層搭建主要是數據模型的搭建,電力數據知識圖譜包括實體元素、關系元素以及知識集合。因此,可用集合來表示知識圖譜,定義kg表示知識圖譜集合,Et為圖譜中的實體元素集合,R為圖譜中的所有實體的關系元素集合,Kl為各實體與關系提取的知識集合。如式(1)所示。
Kg={Et,R,Kl }? ? (1)
數據層的搭建主要是從流程層中的各實體中提取實體之間的關系元素,并進行知識的融合和不斷地更新。
1.實體提取
對于電力數據知識圖譜有基本的實體,屬性作為支撐,不同的實體均有對應的屬性和攜帶信息,然后通過流程相連,也就是實體下有一個流程,流程下包括屬性和屬性信息。屬性可以有多個,但一個屬性對應的實體和流程是唯一的。本文電力數據的知識圖譜主要實體關注電力設備信息、經營數據信息、設備診斷信息以及故障預警信息等。知識提取主要采用機器學習算法進行識別和抽取,具體流程和方法如下:電力設備信息、經營數據信息、設備診斷信息以及故障預警信息均為名詞實體,本文選取深度雙向編碼模型也就是bert模型,來對各電力數據的實體進行提取。流程如下:
①通過標簽定義的方式形成實體的原始集合,作為輸入來對雙向模型進行訓練,標簽主要是依據實體的特征進行定義,標簽主要包含實體頭部特性,實體中部特性,實體尾部特性以及其他非實體特性。
②選取電力數據的原始數據,一般為設備中可導出的excel文件,主要是對文件內的表頭以及元組名進行識別,識別成功后,提取實體及關聯數據。
③選取故障預警信息的原始數據集,其中包括序號、時間、設備名、類型、描述、級別、當前值、報警值、恢復值、用戶、響應時間等。對這些實體進行識別提取,并標注,如實體頭部信息日、設、類、級、報、當、恢等,尾部信息間、名、型、別、值等。對2200條記錄進行特征標簽,在樣本中選擇1900個作為訓練集,其他300作為驗證集。模型驗證可選擇時間、設備名、類型、級別、當前值、報警值以及恢復值等結果。
2.關系提取
電力數據知識圖譜的包含的基本關系R可用式(2)來表示。
R=(NS→[RN:P]→NE)?(2)
記NS為頭特征實體、NE為尾特征實體,RN為關系名,P為實體的屬性。箭頭指向說明關系的指向。各實體之間通過機器學習雙向編碼模型識別進行提取。
3.知識融合
知識融合是電力數據知識圖譜中關鍵的環節,也就是將各實體中基本釋義相近的結合成單個實體統一表示,如式(3)所示。
E={E1,E2,…,En } (3)
式中,記E1,E2,…,En表示n個釋義接近的實體,E為結合后的整實體。
對于電力數據知識圖譜的構建中,知識融合的方法存在部分問題:如對于實體的選取中,各實體的名稱還存在一定的差異,存在有實體名簡稱以及實體名的相近名稱等,如在告警信息的提取中,存在設備名-變量名、事件類型-告警類型、等級-級別、日期時間-告警時間等。這些實體均為同一實體,只是名稱有所變化,此種情況對于規則的制定情況比較復雜,也難以制定統一規則,因此知識融合可以采用聚類算法開展,也就是首先遍歷原始數據中的各個實體信息,通過相似度評估來統計實體之間的相似度,并設定相似度比較值,高于比較值的實體被認定為相近實體進行融合,相似度Sm計算如式(4)所示。
式中:X為實體1經過拆分單個名詞統計到單詞的出現頻率,y為實體2經過拆分單個名詞統計到單詞的出現頻率,X、Y均是一個向量。相似度越高,表明X和Y實體相似度越高。
4.知識更新
由于信息網絡的不斷覆蓋,電力數據的維度和廣度不斷擴大,因此數據量也變得十分龐大。為了保證電力數據知識圖譜模型的分析有效性,需要及時進行知識的更新。目前,電力數據的維度有限,但隨著智能化電力設備及設施的不斷開發和建設,一些其他數據的價值也不斷凸顯。因此,需要對電力數據知識圖譜的數據層進行相應的調整和變更。新加入的實體及屬性信息也需要經過知識融合后才能形成完整的知識圖譜。同時,需要對不適用的關系和流程進行更新和剔除,以確保知識圖譜的時效性和準確性。
(三)電力數據知識圖譜的可視化
通過高性能Neo4j數據庫對本文電力知識圖譜進行頁面展現,可以集中展示電力數據知識圖譜中的實體、屬性和聯系。這種展示不僅能清晰展現電力數據知識圖譜的結構,還可以支持快速的查找功能。特別是針對設備狀態和告警信息,快速查找功能可以幫助快速定位問題并有效處理,進一步提高工作效率。
三、電力數據知識圖譜的典型應用
本文以電力數據中的設備故障告警事件為案例,以分析和建議電力數據知識圖譜在該事件中的應用,并進一步分析結果。在2020年湖南省某村鎮突然出現大面積斷電的事件中,當地供電公司迅速組織了排查工作,并成立臨時保障小組,進行了指導、勘察、排除和檢修等一系列環節。經過6個小時的排查和檢修,最終成功恢復了供電。事故的原因在于該鄉鎮的300多臺電力終端中有一臺發生故障,導致了全線停電。從上述案例中可以看出,雖然供電公司響應及時,但是排查問題的速度需要進一步提高,無法在規定的2小時內完成供電的恢復,從而造成了該地工業產業方面的損失。為了快速解決此類事件,可以通過電力數據知識圖譜來分析設備狀態和故障告警信息,從而快速定位到故障終端,并進行維修和通電操作,以減少工業企業的損失。
本文基于終端搭建的停電事件數據知識圖譜,通過收集上表終端設備中的各類信息,通過收集終端設備中的各類信息,可以快速識別出可疑終端Vm74。盡管這臺終端沒有出現設備告警信息,但是通過知識圖譜結合設備運行狀態、設備溫度、設備使用時間和設備讀數時延等多種信息進行綜合評判,人們可以找到運行狀態、溫度、使用時間等異常的終端,并根據算法權重計算風險指數,發現Vm74設備溫度達到了33.4度,設備讀數延遲達到了11.3秒,綜合風險指數達到了90%。因此,Vm74成為了需要關注維修的重要設備。這與實際事故檢修的結果一致,識別率較高。
四、結束語
本文基于電力數據的發展現狀,旨在研究電力數據的潛在價值,并利用知識圖譜與電力數據相結合,搭建了電力數據知識圖譜。通過對電力關鍵指標數據的分析,能夠快速定位電力數據的影響因素。同時,通過一個電力停電故障的實例,分析了電力數據知識圖譜在提升電力業務效率方面的有效性。