梁瓊, 湯奕雄, 李弘運, 雷棟梁, 吳昊
(國網湖南省電力有限公司信息通信分公司, 湖南 長沙410004)
目前, 電力通信調度員通過通信管理系統內的缺陷單記錄來跟蹤通信故障, 基于歷史故障記錄整理形成通信故障典型案例庫等文檔, 但日常各類典型問題的處理經驗尚未形成統一、 有效的知識庫。對于突發通信故障, 調度員在處理通信故障時雖然已具備一定的能力, 但由于缺乏自動化輔助決策工具, 在面對多起突發嚴峻故障或復雜故障時, 往往在故障告警情況確定、 運行資料確認核實、 歷史告警情況參考、 故障綜合判斷等方面耽誤較多時間,降低了故障處置效率, 在故障處理能力、 協調、 及時性方面仍需加強。 調度員需憑個人自身經驗和現場情況來分析和定位故障, 在及時性和準確性上還需要提升[1-5]。
為快速有效地處理通信系統突發事件, 最大限度地減少其對生產、 經營、 管理造成的損失和對社會的不良影響, 可以建立適用于電力通信的故障研判體系作為支撐, 進而不斷完善通信系統分析體系和決策機制, 提高電力通信調度員的組織指揮能力和應急處置能力, 提升通信系統的安全穩定運行水平。 同時, 如火如荼的電力物聯網建設, 為開展通信故障智能研判系統的研究工作提供了數據采集分析的基礎[6-9]。
本文設計一種通信故障智能研判分析決策系統, 分析通信管理系統、 專業傳輸網管系統等在線監測系統的數據, 幫助調度快速熟悉故障影響范圍、 精準定位故障點、 同類故障歷史處置情況, 提供臨時最優應急迂回方式通道選擇, 提高處置故障的時效性、 準確性, 減小故障影響范圍, 從而避免誤派、 多派人員, 減少人力物力浪費, 降低造成更大損失的風險[10-15]。
在電力通信網中, 通信設備品牌眾多, 導致管理工具多且分散。 當發生通信故障時, 需前往對應品牌管理工具上進行光路、 業務核查等操作, 通信故障處置時長因此增加。 而通信智能研判系統的告警分析模塊通過分析電力通信網全網通信告警, 并結合電力通信光纜資源、 光路資源、 通信告警信息庫等數據進行綜合研判, 定位通信故障點并提示故障影響范圍, 縮短故障處置時長和幫助信通調度員摸清故障風險點; 同時也會根據告警對象來調出歷史告警和對應的歷史缺陷單, 幫助電力通信調度員快速熟悉故障處置流程。
首先建立一個通信告警信息庫, 存儲電力通信網所有通信設備的告警名稱、 告警原因、 故障類型(主要分為板件故障、 光纜故障和線纜故障) 等信息。 當故障發生時, 對當前所有告警在電力通信光路資源數據中進行匹配, 判斷是否有對應的光路。
如果沒有對應光路, 繼續在通信告警信息庫中進行匹配, 找出對應的故障類型。 如果是板件故障, 則顯示故障站點、 故障設備廠家、 故障板件名稱、 故障板件槽位、 故障原因和對應處置方案; 如果是線纜故障, 則顯示故障站點、 故障設備廠家、故障線纜對應的通信設備端口信息、 故障原因和對應處置方案。
如果有對應光路, 則是光纜故障, 則繼續在通信告警信息庫中進行匹配, 找出對應的告警原因(光路中斷或光路性能下降), 并對比中斷光路的光纜路由信息找出共同光纜段, 顯示故障定位的光纜段、 故障的光路信息、 故障原因和對應處置方案, 其工作流程如圖1 所示。
本系統的故障預判模塊與告警分析模塊的工作原理基本一致, 只是故障預判針對的不是當前故障, 而是提前對某一通信故障進行模擬來分析該通信故障的影響范圍等, 便于電力通信調度做出方式、 檢修、 特巡保障等風險預控安排, 將隱患風險控制到最小, 避免設備等級事件的發生。
推薦應急路由又分為推薦應急通道路由和推薦應急光路路由。
推薦應急通道的工作原理是將故障對應的所有影響通道信息帶入推薦通道參數中, 然后將滿足避開要求的路由作為推薦的路由。 影響通道信息包含起止站點、 設備、 端口、 速率和避開光纜信息。 避開的要求為可用時隙不夠的光路、 與影響通道同屬同一業務下另一個通道同路由的光纜、 故障光纜。推薦應急通道的工作流程如圖2 所示。

圖1 告警分析模塊工作流程

圖2 推薦應急通道路由模塊工作流程
應急通道路由推薦邏輯是根據起始設備查詢光路, 找到滿足起始設備要求的光路, 再將光路終止設備作為起始設備查詢光路, 循環執行(如果一直有滿足條件的數據, 最多查找35 個節點)。 找到某個節點的光路通道的終止設備相同時則為一條推薦通道, 記錄每條推薦通道, 根據評分規則評分, 推薦時過濾掉不符合規則配置條件的數據。
推薦應急光路路由的工作原理是將故障對應的光路信息帶入推薦光路參數中, 然后將滿足避開要求的路由作為推薦的路由。 影響通道信息包含起止站點、 設備、 端口、 速率和避開光纜信息。 避開的要求為可用芯數不夠的光纜、 與影響光路上所有受影響通道的同屬同一業務下另外一個通道同路由的光纜、 故障光纜。 推薦應急通道的工作流程如圖3所示。

圖3 推薦應急光路路由模塊工作流程
應急光路路由推薦邏輯是根據起始站點查詢光纜, 找到滿足起始站點要求的光纜, 再將光纜終止站點作為起始站點查詢光纜, 循環執行(如果一直有滿足條件的數據, 最多查找35 個節點)。 找到某個節點的光纜的終止站點與推薦終止站點相同時則為一條推薦光路, 記錄每條推薦光路, 推薦時過濾掉不符合規則配置的數據以及不符合篩選條件的數據。
本系統利用監測的數據進行分析, 通過分析通信管理系統、 專業傳輸網管系統等在線監測系統的監測數據, 提高運維決策的針對性和處置故障過程的管控能力。 通信故障智能研判系統包括告警分析、 故障預判、 推薦應急通道等模塊。 告警分析與故障預判的邏輯是一致的, 所以在故障預判中模擬了一次故障來驗證通信智能故障研判系統應用的可靠性和準確性。
模擬兩條有共同光纜段的光路出現故障, 告警信息為兩條光路雙端站點分別都收不到光信號。 當選擇這四條告警進行分析后, 系統會出來故障光路的基本信息和故障光纜段的基本信息。 系統的分析結果與實際分析對比是準確可靠的。 此外, 基于大數據的通信故障智能研判系統還可以推薦應急路由, 對模擬光纜故障中中斷的光路進行應急光路路由推薦, 推薦的應急路由會有多條, 并從最佳應急路由往下排列, 為電力通信調度提供多種選擇, 調度可以根據實際情況從中選擇應急路由進行迂回。
1) 部署簡單: 可以開通電力通信調控中心指定的內網電腦訪問和操作該系統的權限, 無需安裝。
2) 定位精準: 系統可以準確定位故障點, 并推薦應急路由和提示故障影響范圍。
3) 操作便利: 該系統功能明確, 操作簡單,更利于剛接觸電力通信調度的調度員快速定位故障點。
對基礎數據的要求較高。 一切分析都基于基礎數據, 若基礎數據出現問題, 會嚴重影響分析結果的準確性。
數據源量較大。 為了準確定位故障, 通信故障智能研判系統是對當前通信告警進行分析, 對計算資源有一定要求。
通信故障智能研判系統通過模擬一次故障, 驗證了其在定位故障, 分析影響范圍情況和推薦應急路由等方面準確性和可靠性。 該系統為電力通信故障處置提供了智能工具, 提高了故障處置率。 下一步, 計劃在本系統的基礎上繼續深化, 開展基于人工智能的通信調度機器人的研究工作。