民航中南地區空中交通管理局通信網絡中心 楊湘琪
淺談FA36業務監控軟件對民航業務運行質量的檢測與分析
民航中南地區空中交通管理局通信網絡中心 楊湘琪
隨著民航通信網絡的逐步擴大,業務不斷增加,規模迅速擴容,對業務傳輸運行質量的監測成了一大難題,在目前民航各大傳輸系統中沒有專門針對業務傳輸運行質量進行監控的軟件,廠家提供的系統監控軟件只對業務端口的狀態和協議進行監控,當需要檢查業務傳輸質量時,只能由值班人員人工遠程登錄設備輸入一系列煩瑣復雜的指令去查看,既適應不了龐大的業務量,又無法實現實時監測。中南FA36傳輸網綜合業務監控軟件正是我們為解決這一難題而自主研發的,其應用范圍遍布中南各省局臺站,本文主要對該軟件的研發背景、主要功能進行介紹,并以對干線運行質量的檢測分析為例介紹了軟件功能實現的原理。
FA36;華為H3C;ATM干線;中南FA36傳輸網綜合業務監控軟件
FA36中南網以廣州區域管制中心和廣州新白云國際機場為核心節點,采用雙星型的組網拓撲,全網共建成了FA36 A網和FA36 B網兩張物理上完全隔離且相互獨立的傳輸網絡,覆蓋了北至鄭州,南到西沙群島的中南各地大部分的航管樓、甚高頻臺和雷達站等,承載了各類運營商及民航光纖干線接入,以及雷達、電報、AIDC等空管業務。對于這樣一套關乎安全生產的重要系統,卻無法準確、實時地監控其承載業務的運行狀態及數據傳輸質量,FA36系統廠家雖然提供了網管軟件,但其網管軟件存在以下問題:
(1)未考慮不同業務類型自身的特點,例如干線口與ATM設備連接時配置成幀中繼方式,網管軟件仍然以檢測端口狀態是否正常作為判斷ATM干線正常與否的標準,但實際上當ATM干線中斷時,FA36設備端口狀態并未發生變化,這就造成無法正確判斷干線故障。
(2)各種類型告警無法分門別類地靈活選擇屏蔽,一些不需要引起重視的次要故障聲音告警會影響值班人員的注意力,容易造成當真正發生故障時產生麻痹心理。
(3)系統自帶的告警聲音拖沓且只響一聲就停止,容易被忽略,存在很大隱患。
(4)只能監控業務端口的物理、協議狀態,無法根據干線、電報、雷達業務各自的特點去判斷傳輸業務是否中斷和數據質量,當端口狀態正常,但傳輸業務中斷或數據質量不好時并未起到告警作用。
(5)各種業務故障日志混淆在一起,顯示混亂,且無法明確看出故障起始時間。
由于網管軟件存在的種種不足,如果想對FA36設備所承載業務的運行質量(狀態)進行實時、準確的分析與監測,同樣需要值班人員不停地輸入指令去讀取、分析業務端口狀態,同時作出快速、準確的判斷,而現實情況決定了這樣做是不可能的,因為FA36系統業務量的龐大遠在FA16、馬拉松等其他傳輸系統之上,除了作為廣州與中南各地之間電報主、備用信道傳輸路由之外,所有從中南、華東各地經地面側和空側路由引接至廣州的雷達信號,最終都接入廣州FA36系統,再經由廣州FA36系統分發至各地用戶。
(1)根據不同用戶需求,提供各類人性化的配置窗口,使用戶通過簡單配置即可以靈活實現對不同節點、不同端口上承載的各類業務進行監控;通過配置可將告警信息的啟用或屏蔽細化到針對具體某個業務,告警類型根據不同業務的重要程度可以靈活地設置不同告警手段。
(2)用戶通過配置窗口提供給軟件的各類信息自動保存在配置數據庫的各類表格中,在軟件運行時,將自動讀取數據庫中各類信息,瞬間初始化用戶界面,直觀明了。
(3)自動登錄各個FA36節點,以毫秒為單位自動發送各類檢測命令,24小時不間斷對FA36中南網上承載的各類業務傳輸情況進行檢測,并根據不同設備、板卡類型,以及不同的業務類型分別提取有用的數據進行分析判斷。
(4)對不同業務類型,如干線(ATM、電信、聯通、衛星等)、雷達(源端、接收端)、電報(收發雙向、單收、單發)、AIDC(收發雙向、單收、單發)等業務根據其不同特點,分別為其量身定制最為合適的判斷機制,避免以偏概全而做出不正確的判斷。
(5)將檢測判斷過程中實時產生的各類告警信息通過顏色、聲音等直觀的方式通知用戶,同時詳細地計算、記錄各類告警信息和業務傳輸質量,比如通過干線、雷達、電報、AIDC故障日志記錄各類業務中斷時間、恢復時間以及中斷時長;每20分鐘計算一次干線、雷達誤碼率,通過干線、雷達誤碼率日志詳細記錄干線、雷達在20分鐘內的傳輸數據量、誤碼量及誤碼率等情況。
(6)提供數據庫維護功能讓擁有相應權限的用戶可以按需刪除日志數據庫中各種日志表的過期記錄信息;可以手工備份配置數據庫和日志數據庫,必要時還可以恢復到之前備份的配置數據庫。
(7)從軟件使用的安全性出發,對用戶權限進行嚴格規劃,提供用戶管理界面對用戶賬號進行統一管理,不同的用戶權限賦予查看、配置、維護等不同功能權限,詳細記錄各類用戶操作日志。
(8)通過運行在廣州區管的集中監控模塊實時接收來自中南各地監控模塊發送的各類業務狀態信息及故障日志,從而實現對雷達、電報、AIDC等業務從源端到接收端的傳輸情況形成完整的監控鏈,便于一目了然地判斷故障點、大大地減少值班人員的工作負擔。
下圖是運行在廣州區管的FA36業務監控軟件主界面:

下面以對干線運行質量的檢測分析為例,來介紹軟件功能實現的原理。
對干線運行質量的檢測與分析主要根據干線類型分為兩大類:一類是ATM干線,另一類是除了ATM干線之外的其他干線,包括電信、聯通、KU衛星、TES衛星和以太網干線。
對ATM干線的監控可通過發送dis fr pvc命令查看所有ATM 幀中繼端口的虛電路狀態,提取status值做為判斷ATM干線正常與否的依據,當status值為ACTIVE時,表示該干線正常建鏈,當ATM干線中斷時,其status值為INACTIVE,對ATM干線不需檢測其誤碼情況。(如下圖紅框所示)

對ATM干線以外的其他干線的檢測,主要通過發送dis int +端口號查看端口、協議狀態和數據收發情況,提取Line protocol current state值作為判斷干線正常與否的依據,當Line protocol current state為UP時表示干線正常,當Line protocol current state為DOWN時表示干線中斷。(如下圖紅框所示)

對于無法從端口協議和虛電路去判斷鏈路正常與否的干線,我們同時結合PING該干線對應端口IP地址的方式進行檢測,并根據返回字節和生存時間去判斷干線是否正常。
同時每隔20分鐘提取Input packets值和errors值計算干線誤碼率,對于端口收發數據顯示如下圖所示的設備板卡端口,計算公式為(errors2-errors1)/(input2+errors2)-(input1+errors1),其中input1和input2分別為前后兩次提取的input packets值,errors1和errors2分別為前后兩次提取的errors值(如下圖紅框所示)。

對于端口收發數據顯示如下圖所示的設備板卡端口,計算公式為(errors2-errors1)/(input2-input1),其中input1和input2分別為前后兩次提取的input(total) packets值,errors1和errors2分別為前后兩次提取的errors值(如下圖紅框所示)。

不同型號的FA36設備和不同型號的板卡在業務端口狀態、協議狀態以及數據收發信息顯示的格式可能不同,因此需考慮到各種可能出現的情況,在實際運行環境中提取端口信息數據進行分析,按不同的數據顯示格式識別提取對應值。
近年來,中南FA36傳輸網綜合業務監控軟件已陸續在廣州新機場和廣州區管中心,以及武漢、長沙、汕頭、桂林、南寧、珠海進近、湛江、鄭州、深圳、海口等中南各地省局航站投入使用并發揮了很好的作用。由于華為H3C FA36設備在全國各大管理局應用廣泛,且該軟件經過多年的研發改進,已經針對歷年來民航系統引進的各種型號FA36設備和板卡狀態信息顯示的異同進行總結,測試過對不同型號設備和板卡所承載業務的運行質量均能做出準確的分析判斷,只需進行簡單配置即可應用于其他管理局的FA36業務傳輸網絡,有一定的推廣意義。
[1]H3C FA36產品培訓[S].杭州華三通信技術有限公司.
[2]FA36 中級培訓手冊[S].民航中南地區空中交通管局通信網絡中心通信樞紐室.
[3]鐘軍,汪曉平.DELPHI 網絡通信協議分析與應用實現[M].人民郵電出版社,2003.