林冠強 李惠松


[摘? ? 要]面向越來越復雜的電網領域,采用智能化技術構建了新型電網知識圖譜(Knowledge Graph—KG),結合大數據和云計算的多元化服務需求,分析知識圖譜在電網中的應用。針對知識圖譜共建、共享需求,設計出知識圖譜框架與本體庫,提出切實的知識識別與關系抽取的實用化方法,為大規模知識圖譜構建提供實用化技術支持,改善電網業務文件數字化自動提取水平和電網知識檢索技術,降低專業要求,同時提升電網知識圖譜構建效率。
[關鍵詞]電網領域;智能化技術;知識圖譜;知識識別;關系抽取
[中圖分類號]TP18 [文獻標志碼]A [文章編號]2095–6487(2021)04–00–02
Construction and Application of Power Grid Knowledge Graph
Lin Guan-qiang,Li Hui-song
[Abstract]Facing the increasingly complex power grid field, intelligent technology is adopted to construct a new power grid knowledge graph (KG—Knowledge Graph), combining the diversified service requirements of big data and cloud computing, and analyzing the application of knowledge graph in the power grid. In response to the requirements of co-construction and sharing of knowledge graphs, a knowledge graph framework and ontology library are designed, and practical methods of knowledge identification and relationship extraction are proposed, which provide practical technical support for large-scale knowledge graph construction. Improve the digital automatic extraction level of power grid business documents and power grid knowledge retrieval technology, reduce professional requirements, and improve the efficiency of power grid knowledge map construction.
[Keywords]power grid field; intelligent technology; knowledge graph; knowledge recognition; relation extraction
2012年,為了進一步改善網絡搜索的質量與速度,美國Google公司首次提出了知識圖譜(Knowledge Graph—KG)這一說法,其中涉及三個方面:實體、屬性和關系。實體通常為客觀存在的事物,屬性通常用來表達事物的特征,關系通常用來實現實體之間或者實體與屬性之間的互聯。實際上,KG為語義網絡,KG中前兩個方面對應語義網絡的節點,而后一個方面對應語義網絡的邊。針對各種數據形式,KG構建方法為:抽取,融合,表示,驗證與推理(圖1)。數據來源有結構化數據、半結構化數據和非結構化數據,抽取方法有三類,屬性抽取、關系抽取和實體抽取。依據不同的領域,KG主要分為兩大類:通用領域和專業領域。前者涵蓋面廣,包含的信息量豐富,然而專業性不高;后者具有一定的針對性,從而實現數據的深度挖掘。
隨著電網的不斷發展和完善,產生了大量的電網數據,通過利用這些數據,有利于提高電網的智能化水平。目前,電網提出能源物聯網的概念,關鍵是建立滿足電網需要的智能化電力知識平臺。本文基于知識圖譜技術,結合KG技術和電網知識,形成電網專業KG,抽取電網裝置的運行信息、管理數據和文獻信息等數據,構建電網KG。把電網中各方面的知識進行深度的融合,智能挖掘電網中的有用信息,引導和拓展新的電網發展方向。
1 電網KG構建
由于電網沒有建立統一的知識平臺,甚至每個部門設置了不同的信息庫,使得電網生產、運行和服務等各個環節均形成了大量的信息,例如,電流、電壓和頻率的變化,開關狀態的改變,電表信息。電網信息化的持續發展,產生的電網數據量越來越多,所需時間越來越短。然而,這些數據輸出沒有統一的格式,不僅含有結構化數據,也存在各類非結構化數據,包括文本、音視頻。KG中針對多源數據來說,結構化數據通常能夠直接進行知識融合;半結構化數據需要采用篩選的辦法,消除干擾數據,進行知識抽取,從而規范數據,形成結構化數據;非結構化數據通常為文本信息,知識抽取過程比較復雜,包括實體識別、屬性抽取和關系抽取三個方面。
電網KG構建,能夠把電網各種數據重新進行整合,從而方便數據的管理與查找,形成真正意義的電網智能化。為了構建電網KG,首先需要全面獲取電網術語,通過這些術語形成電網專業KG基礎。術語抽取采用形式化方法,根據電力相關的置信度,分析該術語的可靠性。然而,如果該術語使用的概率比較小,會降低術語的重要性,增加該術語的統計難度。進一步設置電網專業詞典,有利于理解相關專業術語,增進電網知識學習,促進電網發展,如圖2所示。
通過電網專業詞典能夠查找相關信息,有助于理解這些專業術語,降低KG的構建難度。這些術語來源包括論文數據、百科數據和其他數據,然后初步構建術語語義圖,依據置信度進行排序,基于語義相似度的詞條進行匹配,最后基于隸屬度的定義抽取。電網專業詞典是KG基本數據,對于詞典中數據的量和質要求非常高,量不足使得覆蓋面不廣,質不高使得定義不準確,均難以達到實際效果。然而,整個電網存在的設備儀器眾多,專業術語龐雜,同一設備可能存在多個定義名稱,提高了專業詞典的抽取難度。因此,專業詞典確定過程中,需要進行人工確認,進一步限制了詞典中數據的量和質。目前,隨著電力物聯網的建設,采用大數據和云計算等先進技術,以及人工智能的普及,使得電網KG的構建成為可能,基本涵蓋了電網的各個領域,包括變壓器本體、輸電線路、配電物聯網、柔性交流系統、網絡控制、信息安全等。
2 電網KG應用分析
近些年,電網得到大力發展,信息化普及程度較高,積累了大量運行數據,具有非常高的資源與需求價值,為電網KG的構建提供了前提條件。電網KG的應用領域涉及多個學科,主要分為應用層和感知層,應用層分為配電物聯網和新一代智能電表,配電物聯網的應用組件分為停電管理、電能質量監測和自動無功補償,其中停電管理含有網絡發令和一體化電網平臺;電能質量監測含有電能監控和電力參數測量;自動無功補償含有環網接線和配電網無功補償系統。新一代智能電表支撐技術分為即插即用、邊緣計算和非介入式電荷分解,其中即插即用含有實時性測試和模塊化測試;邊緣計算含有流數據處理和計算遷移;非介入式電荷分解含有數據處理、事件檢測、特征提取和負荷識別。感知層可以分為智能終端和能源路由器,智能終端的支撐技術分為輸電類終端和配電類終端,前者主要為交換機,后者主要為網絡設備;能源路由器的支撐技術為路由器,包括交換機設備、背板總線、信息外網和局域網交換機。
通過這些學科的知識挖掘發現,未來電網發展的熱點領域有人工智能、網絡安全、云計算、大數據、物聯網、區塊鏈和芯片,因此,該KG的建立,能夠有效指導電網的發展。電網專業詞典和KG的構建,以及和現代科技的強力結合,給電網研究指明了方向。這種智能化信息化方式,極大提高了電網的運維水平和管理效率,節約了大量的人力物力和財力成本,使得電網決策更加科學合理。未來電網在配電物聯網、新一代智能電表、輸電物聯網、電力金融、負荷分解、電能質量監測、線路監測、配電終端、電能計量、停電管理和用電安全等方面,將更多地融合可視化、虛擬現實、語音識別、安全性和隱私、機器人、推薦系統、自然語言處理、多媒體、機器學習、物聯網、信息檢索、人機交互、數據庫、數據挖掘、計算機視覺、計算機圖形學和人工智能等技術。
采用人工智能技術,形成電網KG,結合電網的應用領域與人工智能的應用領域進行分析,深入數據挖掘,得到以往的數據研究情況,判斷以后的研究方向。目前采用的技術有:循環神經網絡技術、交叉創新笛卡爾智能分析技術和長短期記憶網絡技術等。依照數據采集數量,建立某個領域的研究模型。
3 結束語
電網KG的構建和應用,有利于解決電網專業知識碎片化的問題,聚焦現代智能技術,從各類數據庫出發,開展電網KG構建,研發云數據中心KG管理平臺。在此基礎上,開發基于知識圖譜智能分析模塊,為電網建立大規模、共享型的KG資源,提供知識計算服務,從而充分發揮大數據和KG的價值。
參考文獻
[1] 俞陽.基于知識圖譜的電力知識平臺關鍵技術研究[D].南京:東南大學,2018.
[2] BIZER C,LEHMANN J,KOBILAROV G,et al.DBpedia-a crystallization point for the web of data[J].Web Semantics:Science,Services and Agents on the World Wide Web,2019,7(3):154-165.
[3] 郭云峰,韓龍,皮立華,等.知識圖譜在大數據中的應用[J].電信技術,2015,1(6):25-29.
[4] WANG J Z,DU Z,PAYATTAKOOL R,et al.A new method to measure the semantic similarity of GO terms[J].Bioinformatics,2017,23(10):1274-1281.
[5] 傅質馨,李瀟逸,袁越.泛在電力物聯網關鍵技術探討[J].電力建設,2019,40(5):5-16.
[6] ZHAO L,ZHANG Q.Mapping knowledge domains of Chinese digital library research output,2014–2019[J].Scientometrics,2020,9(1):51-87.
[7] 蔣瑋,周穎,陳舒淇,等.電網基建工程數據挖掘及知識圖譜構建技術研究[J].電力信息與通信技術,2021,19(2):15-22.
[8] 武斌,張賓,周晶,孫博,等.知識圖譜在電力領域的應用與思考[J].科技經濟導刊,2020,28(16):33.