楊 琴,劉 剛
(1.桂林理工大學南寧分校 計算機應用系, 南寧 530001;2.中國聯通廣西分公司網管中心, 南寧 530003)
在傳輸網日常維護工作中,收發光功率、通道誤碼等是最重要的維護指標。性能指標的變化會直接影響使用傳輸網的其他專業網絡質量的劣化,最終影響到末端用戶感知。
日常通過對網絡性能指標的檢測,了解和掌握全網的運行質量。網絡性能指標的檢測關鍵在于如何高效、快速、完整地收集指標數據。本文通過對性能日志文件的挖掘,研究性能數據的自動收集、自動分析的方法,通過分析處理、歸類存儲、對比展示,方便快捷地查找網絡中存在的性能劣化端口,準確定位網絡劣化區域,為提高維護質量提供指導和參考,在日常維護工作中取得了良好的效益[1-6]。
在設備維護終端管理界面上依靠人工觀察發現性能變化情況,人工查詢登記性能數據,并與以往數據進行比對檢測。這種方式查詢信息量小,查詢效率低,同時人眼在重復性勞動中易產生疲勞、出錯,適用于網元數量較少的場景,不能滿足大量數據快速查詢的需求。
利用數據導出工具導出設備性能數據,再通過Excel等電子表格輔助分析。隨著Excel表格在日常維護工作中的普及,維護人員在日常工作中也可以利用電子表格完成對系統性能數據的統計分析。這種方式的查詢信息量中等,查詢效率中等,對人員技能有較高要求,需要熟悉辦公軟件進行多表關聯分析,每次操作較繁瑣,不宜普及,不能長期保存歷史數據以待翻查。
隨著信息化在通信日常維護工作中的普及,建立綜合網管分析系統,利用設備網管系統接口自動采集、對比、保存性能數據,維護人員在日常工作中通過查詢可以直接獲取相關性能數據。這種方式的查詢信息量大、效率高、不易出錯,可以長期保存歷史數據。但綜合網管系統需要使用網管接口接入各類設備,接口管理嚴格,通常接口只用于綜合網管系統接入。綜合網管系統投資費用大,建設周期長,易受投資計劃影響。
性能日志分析是將設備網管日常運行時對網元周期性測量過程中產生的大量測量文件記錄進行分析。從日志中篩選所需的性能數值,滿足日常維護工作的需求。性能日志分析方法既有綜合網管系統分析方法的能自動化處理、信息量大、效率高、不易出錯的優點,又有能離線分析、不改變原有網絡結構、無需使用網管接口、投資少、見效快的特點,適用于運維投資少,無法建設綜合網管系統的工作場景。幾種分析方法的對比見表1[7-11]。

表1 幾種分析方法的對比
性能日志分析的整體流程是通過收集分析設備網管的性能日志文件,從中分離出有效的數值信息并按設定的數據類別分類存儲。根據維護周期,定期檢測獲取到的數值,從而掌握網絡運行狀態。分析過程共包括數據生成、數據采集、數據處理和數據應用4個處理步驟。系統的整體模塊如圖1所示。

圖1 系統模塊
性能日志文件通過網管統計生成,以文本格式存儲在網管服務器上,通過在客戶端對網管服務器進行配置生成原始日志文件。操作流程見圖2。

圖2 操作流程
生成的性能文件存儲在服務器端,需要采集至本地后完成后續數據處理。通過配置FTP服務,定期檢測服務器端是否有新性能文件生成。每個周期內,客戶端掃描一次服務器上已經生成的文件列表,并和客戶端本地的文件列表進行比較,如出現差異(包括文件大小差異或時間戳差異),就將服務器端的差異文件重新同步到客戶端,從而確保客戶端能夠和服務器端的內容一致。為了減輕服務器端的負荷,減少無效的檢測次數,文件檢測周期應設置成和性能文件產生周期一致,從而在新性能文件產生后及時完成新性能文件同步到本地的操作。
獲得新的性能文件后,需要在客戶端及時掃描原始文件,將原始文件中的各類數據分類存儲至后臺數據庫中。設備原始文件為TXT文件,文件中的記錄格式如圖3所示,可見原始文件的格式不利于后期的數據查詢和統計分析。

圖3 設備原始文件
為方便后期數據應用,需將原始文件格式轉換后分類存儲于后臺數據庫中,以便后期調用。后臺數據庫幾個主要的存儲表格如表2~4所示。

表2 光功率記錄

表3 誤碼記錄

表4 功率參考值記錄
為了完成以上數據格式的轉換,需要使用腳本編輯軟件建立格式轉換腳本。本案例選擇使用Java語言開發程序完成數據轉換處理。
Java是由Sun Microsystems公司于 1995年5月推出的Java面向對象程序設計語言和Java平臺的總稱,由James Gosling和同事們共同研發,并在1995年正式推出。由于Java 編程語言面向對象、分布式、解釋性、健壯、安全與系統無關、可移植、高性能、多線程和動態等特點,使用Java進行腳本程序的編寫,可以應用在多個操作系統平臺,不受設備網管操作環境的限制,可以實現多種設備網管間的復用。
開發轉換程序的工作流程如圖4所示。

圖4 數據格式轉換流程
為了測試新策略的工作效率,對比了日常維護中幾種常見應用場景下改進前后的檢測響應時間和檢測數量。
光功率表示光在傳輸系統中傳輸時的強度,光通信設備的光通信接口需要光功率保持在一定區間內才能正常工作。光功率反映光傳送網絡的運行狀況,是光傳送網的重要性能指標。因此,光功率查詢是傳輸系統日常維護工作中常用的維護操作之一。
1) 終端分析檢測方法。通過設備網管進行某光接口的光功率檢測時,每次只能查詢1個光口,查詢步驟包括電路核查、網元核查、端口核查、功率核查、基準值查詢、差異比較。按每個步驟平均耗時30 s計算,1個端口檢測需要耗時:30 s×6=180 s=3 min,500個端口檢測耗時:3 min×500=1 500 min。
2) 性能日志分析檢測方法。按每次檢測50個端口進行計算。新的檢測方法一次查詢就可以直接列出50個端口的性能數據,同時自動關聯基準值,自動判別差異,操作人員只需關注有差異的光口,無需逐個光口反復比較。通過操作記時,完成一次50端口的檢測約耗時2 min,500端口耗時20 min。性能日志分析檢測方法能夠極大地提升檢測效率。兩者對比如圖6所示。

圖5 終端分析檢測

圖6 性能日志分析檢測方法
誤碼是在信號傳輸中衰變改變了信號電壓,致使信號在傳輸中遭到破壞,產生誤碼。誤碼會引起傳輸性能劣化,進一步擴大會造成業務中斷的重大事故。因此,誤碼查詢是傳輸系統日常維護工作中常用的維護操作之一。
1) 終端分析檢測方法。每次只能查詢1個光口誤碼情況,查詢步驟包括電路核查、網元核查、端口核查、誤碼核查、VC4性能核查。按每個步驟平均耗時30 s計算,1個光口檢測耗時:30 s×5=150 s,500個端口檢測耗時:150 s×500=75 000 s≈21 h。
按全網500個端口計算,要了解全網誤碼分布情況時,需要逐個光口查詢,耗時21 h。
2) 性能日志分析檢測方法。新的檢測方法自動搜索500個端口的全部誤碼信息,根據工作要求設定門限,只報告越界的端口,無需人工逐個端口檢測。通過操作記時,完成一次500端口的檢測約耗時10 min。性能日志分析檢測方法極大地提升了檢測效率,兩者對比如圖8所示。

圖7 終端分析檢測方法

圖8 性能日志分析檢測方法
性能日志分析檢測方法能夠滿足日常工作需要,相比原始的終端分析檢測,能夠大幅提升檢測數量,縮短檢測歷時,提高檢測效率(表4)。

表4 兩種檢測方式在耗時上的比較
網絡性能檢測是網絡維護中重要的、操作頻繁的工作內容,在日常工作中具有重要的指導意義。本文通過對性能日志的研究分析,對檢測工作提出了一種面向運行日志收集和處理、利用日志分析改進網絡性能檢測的方法,并通過兩種常見的工作應用場景,論述說明了如何使用性能數據進行采集分析,形成一套有效的維護指標管理方法,提高了日常維護工作中性能指標周期性檢測的工作效率。實驗結果說明:基于日志分析的網絡性能檢測策略能夠有效滿足日常工作的需求。