劉梓權, 王慧芳
(浙江大學電氣工程學院, 浙江省杭州市 310027)
在電力設備的日常巡檢和試驗中,積累了大量關于設備缺陷情況的缺陷記錄文本[1-2],而在缺陷的分級、消缺等處理工作完成后,相應的缺陷記錄和處理記錄往往閑置于系統中。另一方面,由于缺陷情況復雜多變,目前很多缺陷處理工作依賴于處理人員的知識與經驗[3-4]。如果可以通過一條缺陷記錄檢索具有相同缺陷情況的歷史缺陷記錄,就可以借鑒前人的經驗,參考以往的處理方法對該條缺陷記錄的缺陷情況進行相應處理,這在實際缺陷管理中,尤其是對于知識和經驗相對不足的處理人員有著重要的指導意義。然而,電力設備缺陷記錄的復雜性給缺陷記錄的準確檢索造成了很大困難。雖然有相關的電力規范以表格形式對可能發生缺陷的部件和對應現象等進行了總結[5],但缺陷情況復雜多樣,規范中的表格難以進行全面歸納。即使規范中存在相應的缺陷情況,也常常由于巡檢人員的經驗局限,而出現沒有嚴格按照規范中的方式進行記錄的現象,因此造成了缺陷記錄的復雜性。另外,缺陷記錄是以自然語言的形式進行描述,這進一步增加了計算機對缺陷記錄的理解難度。
文本的檢索效果依賴于文本的語義分析和表示方法的有效性。對于電力設備缺陷文本,類似于文獻[5],文獻[6-7]通過人工經驗確定語義框架,通過框架的填充對文本進行表示,但語義框架的二維表形式缺乏靈活性,難以適應復雜的電力設備缺陷情況[8],且框架的定義依賴于人工經驗,難以全面考慮缺陷記錄多樣化的表達方式。……