鄧顯波 費雯麗



摘 ?要:由于電纜線路運行的年限越來越多以及用電負荷的不斷增長,各種原因導致電纜頻繁地發(fā)生故障,傳統(tǒng)的故障分析手段無法滿足當前的電纜故障診斷任務。文章對近10年的電纜故障歷史案例進行分析和數(shù)據(jù)結構化處理,抽取相關故障特性信息,構建電纜故障知識圖譜,利用人工智能技術建立電纜故障診斷系統(tǒng),該系統(tǒng)初步實現(xiàn)了電纜線路故障的快速分析和診斷,適用于各電力公司一線檢修人員,降低電纜故障分析的難度,且縮短故障分析周期。
關鍵詞:電纜線路;數(shù)據(jù)挖掘;知識圖譜;故障診斷
中圖分類號:TN915.06;TM73 ? ? ?文獻標識碼:A 文章編號:2096-4706(2020)21-0148-04
Analysis of Cable Fault Diagnosis Based on Knowledge Map
DENG Xianbo,F(xiàn)EI Wenli
(China Electric Power Research Institute Co.,Ltd.,Wuhan ?430074,China)
Abstract:Due to more and more years of cable line operation and the continuous growth of power load,various reasons lead to frequent cable fault,the traditional fault analysis methods can not meet the current task of cable fault diagnosis. In this paper,the cable fault history cases in recent 10 years are analyzed and the data is structured. The relevant fault characteristic information is extracted,and the cable fault knowledge map is constructed. The cable fault diagnosis system is established by using artificial intelligence technology. The system initially realizes the rapid analysis and diagnosis of cable line faults,which is suitable for front-line maintenance personnel of various power companies,reduces the difficulty of cable fault analysis,and shortens the fault analysis cycle.
Keywords:cable line;data mining;knowledge map;fault diagnosis
0 ?引 ?言
我國城市電網系統(tǒng)電纜化率逐年提升,電纜線路安全運行的重要性日益凸顯。近年來,由于用電負荷不斷上漲等原因致使電纜故障頻繁發(fā)生。目前,國家電網公司系統(tǒng)內的高壓電纜線路總長度已超過3萬千米,近幾年的高壓電纜故障次數(shù)年均幾十次,分布在電纜和附件不同位置,且故障原因多樣化,每年組織電纜線路的故障分析也成為一項非常重要的工作[1,2]。電纜線路一般敷設于地下通道,一旦發(fā)生故障,搶修工作時間緊、難度大,電纜故障原因分析專業(yè)性強,且費時費力,甚至很多線路的故障因缺乏專業(yè)人員協(xié)助分析很難找到真正的故障原因,這在全國很多運維單位都是普遍存在的問題。一些重要的高壓電纜線路發(fā)生故障時,公司相關部門會組織專家對該故障現(xiàn)象進行分析和論證,得出故障原因,并給出解決問題的建議。國內近些年形成了很多典型的電纜故障案例,而公司系統(tǒng)對這些高壓電纜故障案例的管理缺乏有效的信息化手段,現(xiàn)有的很多故障案例資源只能成為個例,沒有對其他的故障案例分析發(fā)揮研判借鑒作用。
為了提高系統(tǒng)運行的可靠性,在發(fā)生線路故障后,運維單位首先應盡快有效恢復線路運行,并且要盡快分析和總結故障案例,提出檢修的意見以及對應的整改措施,避免再次發(fā)生類似的故障。目前,全國范圍內電纜數(shù)量大,基層運維管理專業(yè)人員相對緊張,電纜故障人工分析難度大,因此,采用人工智能技術建立電纜故障快速分析手段的需求日益迫切。
隨著大數(shù)據(jù)處理和人工智能技術的快速進步,當今世界已步入互聯(lián)互通的信息化時代[3-5],作者針對現(xiàn)階段專業(yè)大數(shù)據(jù)分析能力薄弱、非結構化運檢大數(shù)據(jù)無法實現(xiàn)綜合分析等突出問題,以本公司PMS系統(tǒng)、精益化管控平臺等運維信息交互為切入點,利用大數(shù)據(jù)處理技術和人工智能技術,建立規(guī)范化的電纜故障案例庫,研究故障智能分析算法,建立電纜故障智能研判系統(tǒng),該系統(tǒng)基于大數(shù)據(jù)挖掘技術和知識圖譜關聯(lián)分析技術,實現(xiàn)故障案例特征條件與歷史數(shù)據(jù)的智能匹配,推薦相似故障案例和故障原因,最終生成專業(yè)的故障分析報告,協(xié)助運維人員對電纜線路故障的檢修處理,可以大幅提高電纜線路故障分析效率。
1 ?知識圖譜核心技術
知識圖譜的可擴展性和表達能力都非常強,在進行知識表達時,可以從多種粒度進行表達,要充分利用圖譜的表達能力,使得其能夠為不同應用場景和不同業(yè)務需求提供服務。關于構成知識圖譜的架構,既包括知識圖譜自身的邏輯結構,也包括在構建知識圖譜時所采用的技術架構,如圖1所示。
為了使圖譜資源的內容能夠被計算機所理解,需要對知識內容賦予專門的語義描述框架。語義描述框架(Resource Description Framework,RDF)作為描述資源的機制,可以實現(xiàn)任何領域的資源描述,它通過類以及屬性描述個體之間的關系,這些類和屬性由模式定義。在RDF中,知識總是以三元組的形式出現(xiàn);RDF中的主語是一個個體,個體是類的實例;RDF中的謂語是一個屬性,屬性可以連接兩個個體,或者連接一個個體和一個數(shù)據(jù)類型的實例。
RDF為知識圖譜數(shù)據(jù)的存儲與查詢提供了詳細的規(guī)范描述,具體的研究實現(xiàn)只需要遵循其中的標準即可。
1.1 ?知識標注
由于對知識文檔進行標注的效果主觀性很大,需要人工干涉與審批來判斷標注的結果是否準確合理。本文采用的人工干涉是讓人工專家來對機器標注的結果進行審批,即手工標注。專家對機器標注結果不理想的標簽進行修改,提高整體的標注效果。
自動標注將通過TF-IDF、Jaccard和HowNet語義相似度來得到自動標注的結果,而手工標注將通過Web頁面形式的手工標注技術來對標注結果進行修正。
1.2 ?知識融合
1.2.1 ?模式匹配
模式匹配主要尋找本體中屬性和概念之間的對應關系:
(1)通過使用電纜結構以及WordNet之類的詞典等信息進行模式匹配,然后加權平均整合結果,再通過一些模式去進行檢查,刪除導致屬性不一致的對應關系。通過循環(huán)此過程,直至沒有再找到新的對應關系。
(2)通過基于術語的相似度計算算法,比如編輯距離和N-Gram,對結果進行加權求和再合并,概念之間的層次關系以及相關的背景知識也需要考慮,最后進行合并。
(3)使用錨的系統(tǒng)來應對大規(guī)模的本體,此系統(tǒng)的起點為一對來自兩個本體的相似概念,找出匹配的概念需要通過根據(jù)這些概念的父概念以及子概念等等鄰居信息一點一點地構建小片段。新的錨為新找出的匹配概念,然后再構建新的片段。不斷重復該過程,直至找不到新的匹配概念對。
(4)采用分而治之的思想,來處理規(guī)模龐大的本體,對本地結構進行劃分形成組塊,然后再基于這些組塊進行錨的匹配,此錨指預先就匹配好的實體對,最好找出相應的屬性和概念從所匹配的組塊中。現(xiàn)存在的匹配方法基本上都是將多個算法相結合,然后加權求和或者通過加權平均來合并。但是,由于本地的結構擁有不對稱的特征,此方法存在不足。
(5)動態(tài)的合并方法是通過基于貝葉斯決策的風險最小化提出的,通過本體的特征計算每個實體對的相似度來動態(tài)的選擇匹配算法并合并這些算法,由于其靈活性強所以帶來了很好的匹配效果。
1.2.2 ?實例匹配
實例匹配通過對異構知識源之間實例對相似對的評估,判斷是否有指向給定領域的相同實體的實例。基于快速相似度計算的實例匹配方法,這類方法的思想是盡量降低每次相似度計算的時間復雜度,即降低O(n2t),因此映射過程只能使用簡單且速度較快的匹配器,考慮的映射線索也必須盡量簡單,從而保證t接近常數(shù)O(1)。基于快速相似度計算的方法使用的匹配器主要包括文本匹配器,結構匹配器和基于實例的匹配器等,很多基于文本相似的匹配算法時間復雜度都較低,但為達到快速計算元素相似度的目的,文本匹配器還應避免構造復雜的映射線索。例如映射線索只考慮元素標簽和注釋信息,大規(guī)模知識圖譜匹配中的結構匹配器借助概念層次或元素鄰居文本相似的啟發(fā)式規(guī)則計算相似度,例如兩個實例的父概念相似,則兩個實例也相似等。為避免匹配時間復雜度過高,這些啟發(fā)式規(guī)則不能考慮太復雜的結構信息。實例匹配通常需要通過分類、規(guī)則、聚類等方法實現(xiàn)大規(guī)模圖譜的分塊,同時,并行處理技術能在此基礎上進一步提高匹配結果質量。
1.3 ?基于知識圖譜的語義搜索
基于圖譜的語義搜索(Semantic Search)與傳統(tǒng)互聯(lián)網中的文檔檢索不同,語義搜索能夠處理粒度更細的結構化語義數(shù)據(jù)。
面向文檔的信息檢索主要通過輕量級的語法模型表示用戶的檢索需求和資源等內容,即目前占主導地位的關鍵詞模式-詞袋模型,這種技術對主題搜索的效果很好,即給定一個主題檢索相關的文檔,但不能應對更加復雜的信息檢索需求。相比來說,基于數(shù)據(jù)庫和基于知識庫的檢索系統(tǒng)能夠通過使用表達能力更強的模型來表示用戶的需求,并且利用數(shù)據(jù)內在的結構和語義關聯(lián),允許更為復雜的查詢,進而提供更加精確和具體的答案。
基于知識圖譜的智能搜索總體技術框架從下到上主要分為四層:
(1)數(shù)據(jù)層。即原始數(shù)據(jù)層,各類用戶數(shù)據(jù)、訪問信息、日志等數(shù)據(jù),數(shù)據(jù)類別主要為非結構化數(shù)據(jù)、半結構化數(shù)據(jù)和結構化數(shù)據(jù)等。
(2)存儲層。包括搜索數(shù)據(jù)存儲和三元組知識圖譜數(shù)據(jù)存儲。
(3)搜索層。包括搜索配置、搜索核心模型和搜索分析,其中搜索配置主要包括分詞策略配置、同義詞設置、黑白名單配置等基礎搜索配置項;搜索核心模型包括NLP模型、基于知識圖譜的意圖識別模型和Learning to Rank等;搜索分析主要提供針對搜索內容、搜索結果的基礎分析功能。
(4)接口層。即對外提供的所有搜索相關的接口,主要包括主搜索接口、智能提示接口和相關搜索接口等。
1.4 ?基于知識圖譜的問答
自然語言問題給定之后,就對問題進行語義理解和解析,然后通過知識庫對解析結果進行查找、推理得到最終答案,完整的基于知識圖譜的問答系統(tǒng)需要包括幾個模塊,分別是基于知識圖譜的命名實體識別、會話補全、意圖識別及查詢構建。同時,為了提升問答系統(tǒng)的交互體驗,可以從以下幾個方面來進行部署實施,包括相關問題推薦、問題提示等。
2 ?電纜知識圖譜構建與故障診斷
2.1 ?總體構建
知識圖譜中的知識來源于結構化、半結構化和非結構化的信息資源,如圖1所示。通過知識抽取技術從不同結構和類型的數(shù)據(jù)中提取出計算機可理解和計算的結構化數(shù)據(jù),以供進一步的分析和利用。通過從不同來源、不同結構的數(shù)據(jù)中獲取知識,然后再對知識進行提取,得到結構化的知識并存入到知識圖譜中。
目前知識獲取通過專家法完成,基于歷史故障案例邏輯關系以及專家人工審核意見,結合線路基本信息和故障現(xiàn)象信息聯(lián)合抽取故障特征條件,歸納總結后形成知識。
知識獲取可分為概念、關系、屬性,其構成一張巨大的語義網絡圖,節(jié)點表示實體或概念,邊則由屬性或關系構成。
電纜故障知識圖譜構建與應用設計的應用架構應分為應用層、服務層、支撐層及數(shù)據(jù)層4個模塊,如圖2所示,其中應用層包含故障知識搜索、故障分析頁面、缺陷問答等;服務層包含圖像分析模型、查詢服務、文檔管理、知識點推薦等;支撐層包括知識抽取、知識計算、知識建模、實體融合等功能;數(shù)據(jù)層主要包括知識存儲等功能。
2.2 ?電纜故障圖譜構建
電纜故障圖譜概念包括:電力單位、電纜線路、關聯(lián)廠家、故障信息、故障大類、故障中類、故障特征描述、故障原因;圖譜關系包括:電纜線路所屬電力單位,電纜線路關聯(lián)生產廠家,電纜線路與故障信息通過線路信息進行關聯(lián),故障信息通過故障名稱與故障大類、中類、特征描述、原因進行關聯(lián)。
對電纜故障結構化數(shù)據(jù)按數(shù)據(jù)模板進行導入,通過構建的知識圖譜模型實現(xiàn)全局構建。知識檢索通過從目標節(jié)點開始檢索,到關聯(lián)方查詢、到探尋節(jié)點間的關聯(lián)關系。如圖3所示,電纜故障診斷程序為:
(1)發(fā)生一起電纜線路故障后,工作人員通過查詢線路檔案信息,并在故障現(xiàn)場進行觀察,以及輔助一些必要的試驗,得出該起故障的現(xiàn)象信息,經疏理歸納后可作為診斷故障元的特征條件。
(2)在故障診斷界面輸入故障特征條件,通過故障特征檢索關聯(lián)信息,探尋關聯(lián)方故障案例的描述語句。
(3)已構建的電纜故障案例庫按照故障大類-故障中類-故障特征描述來進行分類。因此,在診斷檢索時也按此順序進行。例如:某起電纜本體故障,先檢索故障大類(如施工安裝),在施工安裝大類中再檢索故障中類(如敷設安裝時導致電纜機械損傷),最后通過具體的故障特征描述(如電纜外層出現(xiàn)高溫燒蝕,在外部溫度作用下,絕緣逐漸遭到破壞最終引起電纜擊穿事故;電纜外護套安裝時出現(xiàn)損傷,鋼絲鎧裝在角鋼支架上形成接地,鋼絲鎧裝中出現(xiàn)接地環(huán)流使鎧裝和支架接觸部分出現(xiàn)高溫,導致電纜絕緣破壞進而出現(xiàn)擊穿)確定匹配度最高的歷史故障案例信息(某公司110 kV交聯(lián)聚乙烯絕緣電纜故障)。
(4)通過上述關系檢索診斷出的匹配案例的分析,得出故障原因,作為診斷結果的輸出。診斷界面最后打印診斷報告,診斷報告的內容包括故障概況、故障現(xiàn)象與分析、結論與建議。
2.3 ?電纜故障診斷系統(tǒng)
基于上述知識圖譜故障診斷模型,本文建立了一個電纜故障診斷系統(tǒng)。該系統(tǒng)的輸入參數(shù)包含基本信息和故障特性信息,基本信息包括:線路名稱、所屬單位、電纜廠家或附件廠家、投運時間、電壓等級、運行年限、電纜及附件規(guī)格型號等。故障特征信息包括:故障類型(本體、接頭、附件),若故障類型為本體,需確定故障類型的大類和中類,若故障類型為接頭或附件,須確定接頭或附件的類型及擊穿通道位置,最后給出故障描述,并附上分析圖片。該平臺的輸出參數(shù)主要包括故障原因和建議,其中故障原因根據(jù)不同因素分為三級原因和具體原因,最后給運維人員提供相應的檢修建議。圖4是電纜故障診斷軟件界面。
3 ?結 ?論
本文對近10年的電纜故障歷史案例數(shù)據(jù)進行結構化處理,建立電纜故障案例庫,通過抽取歷史故障數(shù)據(jù)的特征信息,構建電纜故障知識圖譜,利用人工智能技術,建立故障診斷模型,通過故障特征條件的智能匹配來實現(xiàn)故障原因的快速分析,并給出故障檢修建議,大大縮減電纜線路故障分析周期。
參考文獻:
[1] 楊春宇.電力電纜故障分析與診斷技術的研究 [D].大連:大連理工大學,2013.
[2] 王沐雪,王紫葉,陳語柔,等.高壓電力電纜故障分析及相關技術 [J].通信電源技術,2019,36(5):202-203.
[3] 蒲天驕,喬驥,韓笑,等.人工智能技術在電力設備運維檢修中的研究及應用 [J].高電壓技術,2020,46(2):369-383.
[4] 高海翔,苗璐,劉嘉寧,等.知識圖譜及其在電力系統(tǒng)中的應用研究綜述 [J].廣東電力,2020,33(9):66-76.
[5] 李英,錢建國,王曉,等.基于數(shù)據(jù)挖掘的電網系統(tǒng)故障智能診斷系統(tǒng)研究 [J].自動化與儀器儀表,2020(7):205-208.
作者簡介:鄧顯波(1984—),男,漢族,湖北仙桃人,高級工程師,碩士,主要研究方向:電纜老化狀態(tài)評估、電纜線路運行技術。