黃琳 馬思懿 胡昉 李晶 徐超
【摘要】本文提出一種利用關鍵字匹配的方法,對電力設備維修記錄進行智能檢索并自動分類的臺帳管理模塊。該模塊可根據設備名稱自動檢索湖北省超高壓輸變電公司的臺賬記錄,并對記錄進行分類統計,從而生成設備運行履歷。
【關鍵詞】臺賬;文本;檢索
引言
為實現“一強三優”現代公司的發展戰略目標,國家電網公司于2006年啟動了SG-186工程。SG-186工程中的生產管理系統是公司生產管理業務的信息平臺,設備臺帳數據是生產管理信息系統的重要數據來源,是實現設備生產全過程管理的數據基礎。設備臺帳管理要求實現對設備臺帳的維護、查詢和統計功能。設備臺帳管理模塊的功能有以下需求:各類設備參數臺帳的維護;各種形式的查詢手段;設備從投運到報廢的完整履歷管理。搜集既有設備臺帳數據是為下一階段數據的轉化與導入提供數據準備。正確、有效、合理的數據準備是充分發揮系統作用的有力保證。本文提出一種利用關鍵字匹配的方法,對湖北省超高壓輸變電公司設備維修記錄進行智能檢索并自動分類的臺帳管理模塊。該模塊可根據設備名稱自動檢索湖北省超高壓輸變電公司的臺賬記錄,并對記錄進行分類統計,從而生成設備運行履歷。
1、臺帳檢索分類
制作變電站設備運行臺帳要求將原始檢修記錄文件中所有涉及到某單元的檢修記錄全部檢索出,再根據具體內容加以判斷分類,加入到該單元中對應設備的檢修記錄文件中。以500kV雙河變電站為例,該站設備臺帳層次結構如圖1所示。
現以制作雙河變電站2010年設備臺帳數據為例,需檢索的原始文件內容包括2010年3月至2010年12月雙河變電站所有的設備檢修記錄,共962條,記錄格式如表1所示。
假設我們要檢索的是“500kV雙河09開關單元09高壓斷路器設備運行記錄”,則要求將原始文件中所有關于09高壓斷路器的檢修記錄全部檢索出來并歸入“500kV線路及開關單元設備臺帳”目錄下、“雙09”子目錄下的“高壓斷路器設備運行記錄.doc”文件中。
如果所有臺賬記錄完全按照規范錄入PMS管理系統,則檢索不同設備的記錄時,僅需搜索“設備名稱”與“間隔名稱”兩個字段,并將相應記錄返回即可。然而由于臺賬是手工錄入,勢必存在記錄不符合輸入規范的情況,例如“工作記錄”中出現的設備,并不一定都在“設備名稱”字段中出現。因此,檢索就不能僅依靠“設備名稱”字段進行,而最好利用“工作內容”字段進行。然而“工作內容”字段的錄入是基于自然語言的,因此設備名稱會以不同的形式出現。例如“雙09開關”可能以以下三種形式出現:直接以“雙09開關”形式出現;以“雙09X刀閘”(x為0-9的數字)形式出現;與其它設備并列,設備間以頓號隔開,比如“雙07、08、09開關”,或“雙07X、09X刀閘”等。這些不同的出現方式都增加了檢索的難度。
1.1 人工檢索。人工檢索方法為:在原始檢修記錄文件中查找關鍵字“09”,在所有查找結果中篩選出與09高壓斷路器有關的記錄,將記錄中的“工作日期”、“工作內容”、“完成情況”三項復制,粘貼到“雙09”文件夾下的“高壓斷路器設備運行記錄.doc”文件中。
1.2 自動檢索。臺帳檢索是基于關鍵字的,例如我們要檢索關于雙河09開關單元的記錄,則檢索的關鍵字為:“09”、“開關”、“斷路器”、“刀閘”、“隔離開關”、“電流互感器”等。檢索時存在前述三種情況:1、簡單的關鍵字匹配,即記錄中存在“雙09開關”這種完整表達式,可直接與請求的關鍵字匹配;2、記錄中存在“雙091刀閘”的情況,這時我們只需檢索含有“雙09x刀閘”(其中x為從0到9的數字)的記錄即可;3、最復雜的情況是雙09開關單元設備與其它單元設備并列存在,比如“雙07、08、09開關”,這時我們先檢測“雙”這個關鍵字,再尋找“開關”這個關鍵字,如果“09”關鍵字在“雙”與“開關”關鍵字中間,且中間存在頓號,即算找到匹配記錄。
檢索系統利用C語言在Matlab runtime環境下實現。檢索界面如圖2所示。
點擊“檢查檢索要求”按鈕,可顯示如圖3的對話框,用于檢查檢索要求是否符合用戶需要。點擊“開始檢索”按鈕,可根據檢索要求檢索“待檢索源文件”中的相關記錄,并將結果輸出到與源文件相同目錄下的相應文件中。如按圖2中的檢索要求將輸出檢索結果到“E:\雙河\臺賬檢索(綜合IHM)\500kV\雙09開關.xls”文件中。
點擊“一鍵全部檢索”按鈕,可根據相應腳本,檢索某變電站所有設備的臺賬記錄,并將結果存在相應目錄下。
需要注意的是,針對每一條記錄涉及的所有設備,其檢修內容和完成情況都要歸入到各設備的檢修記錄中,例如某條檢修記錄涉及雙河07、08、09開關,071、072、081、082、091、092、142刀閘,094地刀,共11個設備,那么在原始文件中,在這11個不同的設備名下,此條檢修記錄會重復11次。因此,必須在檢索后自動去掉冗余記錄,否則在統計操作記錄時會出現較大誤差。本文提出的模塊也實現了在檢索分類后自動去掉冗余記錄的功能。
2、人工與自動檢索結果比較
我們仍以“雙河500kV 09開關單元09高壓斷路器設備運行記錄臺帳”為例,人工檢索結果為10條記錄,利用智能檢索并自動分類的方法,檢索出帶重復內容的記錄共76條,自動去掉重復記錄后,檢索出19條記錄。
由此例可見,僅雙河09開關單元09開關一項設備2010年的人工檢索記錄就存在9條漏檢記錄,且人工檢索也可能出現更多重復、錯誤的情況。一個變電站有成百上千項設備,特別是像500kV雙河變電站這樣投入運行接近三十年的老站,不僅設備多,而且很多設備老化,對日常維護檢修工作要求很高,操作記錄很多,制作設備臺帳時人工檢索工作量巨大,容易導致工作人員疲勞,效率低下,且不可避免的會造成臺帳錯誤。
此外,此例中人工檢索時間至少需要二十分鐘,系統自動檢索時間為9秒左右,效率大大優于人工檢索。而隨著工作量的加大,人工檢索效率會越來越低下,系統自動檢索效率不受影響。
參考文獻:
[1]沙勝華,李欣,郭大權.基于發布/訂閱的消息隊列在工作流引擎中的應用研究[J].計算機與現代化,2012,(10).
[2]樊曉光,褚文奎,萬明.基于領域本體的軟構件檢索[J].計算機科學,2009,(06).
[3]馬建剛,黃濤,汪錦嶺,徐罡,葉丹.面向大規模分布式計算發布訂閱系統核心技術[J].軟件學報,2006,(01).