蔡振宇
摘要:隨著民航空管事業飛速發展,自動化系統已經成為保障飛行安全的重要組成部分。寧波的NUMEN2000自動化系統為管制部門提供了可靠的監視和計劃信息,而不斷更新的系統配置數據,在確保空管自動化系統正常運行中占據著越來越重要位置。本文結合日常工作中出現的兩個數據配置和發布的案例及其處理情況,對自動化系統數據配置和發布進行分析。
關鍵詞:萊斯NUMEN2000;自動化系統;數據配置和發布
一、數據配置和發布模塊介紹
NUMEN2000自動化系統包含以下功能模塊:監視數據處理、飛行數據處理、人機界面處理、告警處理、記錄回放處理、軟件與適配數據管理、系統監控等功能模塊。適配數據包括靜態數據和動態數據。動態數據的維護由服務器軟件模塊自動完成;靜態數據包括地圖數據、告警數據、AFTN/AIDC電報處理相關參數、監視數據參數及系統VSP參數等。自動化系統使用數據庫管理軟件(DBMS)對適配數據進行維護和管理。
二、LRF進程(系統日志記錄進程)告警下線案例分析
(一)故障現象
2020年8月某日,萊斯“NUMEN2000”主用自動化系統監控顯示LRF進程(系統日志記錄進程)告警下線,值班員手動重啟LRF進程無效。經排查,該系統FDP1數據庫和LRF數據庫使用了同路徑同文件名但內容不同的數據庫連接文件,在實施補丁升級的數據發布時,誤將用于FDP1數據庫的數據庫連接文件同時發布至DBMS主機,覆蓋了用于LRF數據庫的數據庫連接文件,造成LRF無法正常連接數據庫。重新配置后,LRF連接數據庫正常,進程運行也恢復正常。
(二)原因分析及影響
萊斯NUMEN2000主用自動化系統包含了2類數據庫,分別是FDP1數據庫和LRF數據庫。這兩類數據庫安裝于不同主機,卻使用了同路徑同文件名但內容不同的數據庫連接文件,在做數據發布時很容易混淆。
本次故障中,維護人員在補丁升級時,使用系統自帶的zlcopy腳本進行數據的發布,將用于FDP1數據庫的數據庫連接文件(/usr/oracle/.profile文件和/usr/oracle/oracle10g/network /admin/ listener.org文件)同時發布至DBMS主機,覆蓋了用于LRF數據庫的數據庫連接文件,導致DBMS主機上安裝的LRF進程運行時無法連接LRF數據庫,從而影響維護人員對系統問題的排查。
(三)技術分析及安全建議
1.梳理自動化系統中文件名相同的不同配置文件,在數據發布席位張貼醒目的提示,避免因數據發布不謹慎影響系統的正常運行。
2.細化自動化系統升級的工作方案,將程序和文件的備份、發布等所有操作步驟在工作方案中詳細說明。
3.合理利用自動化系統測試平臺,不僅包括程序功能和穩定性的測試,更要將工作方案中的升級步驟測試納入測試范圍。
4.嚴格遵照經自動化系統測試平臺測試驗證的工作方案實施系統升級工作,切勿心存僥幸,確保升級工作準確無誤。
5.應盡量避免積累多次參數修改或軟件升級后集中發布。逐個逐次發布,在發布出現問題時能夠迅速判斷原因,消除故障。
三、落地報無效地址案例分析
(一)故障現象
2020年11月某日,上海虹橋網控反映烏魯木齊收到本場落地航班CSN6395其落地報的收報地址庫中存在無效地址ZWWWUOXX,查看報文發現萊斯NUMEN2000主用自動化系統TWFDD2終端拍發的落地報中有該地址。
(二)原因分析及影響
1.檢查萊斯NUMEN2000主用自動化系統FDOP中收報地址庫及航空公司收報地址庫,發現均無該收報地址。
2.檢查FDP/config/aftn_data下的local_quguan_address.data和airport_quguan_address.data也未發現該收報地址。
3.查找FDP中AFTN_LOG,找到對應收報地址庫的檢查字段:GetCompanyAFTNUnitByREGID===regid/B5238;===CONPANY/ZWWWCZ;EACHCOMPANY=ZWWWCZ;判斷原因為機號和航空公司一致導致向該收報地址拍發報文,檢查DBMS發現PLANENO TYPE中有機號B5238其NO為ZWWWCZ,對應查找SUBCOMPANY有ZWW WCZ,其SITUATION為ZWWW,SAFTNADDRESS為ZWWWUOXX。
4.該問題會導致報文無法正確拍發到相應地址,需及時溝通站調校對收報地址正確性后對改地址進行改正,涉及系統靜態地址庫的,可先確認正確的地址,在FDOP的收報地址庫中先行增加該地址,待到確認修改材料后再進行
(三)技術分析及安全建議
1.萊斯NUMEN2000主用自動化系統的收報地址庫在日常維護中會定期更新增加相關內容,但DBMS的PLANENO TYPE和SUBCOMPANY中相關資料在建立后缺少及時性的資料更新機制,存在資料老舊的情況。
2.DBMS的PLANENO TYPE和SUBCOMPANY在日常維護中使用較少,值班維護人員缺少經驗,對相關問題排查較為生疏,可能無法鎖定問題關鍵點。
3.收報地址庫的更新與管制站調溝通存在不足,發現的問題應及時與管制站調進行溝通。
4.本次地址錯誤的問題,與虹橋網控溝通后,得知該ZWWWUOXX已經更改為ZWWWUOCZ,會與管制站調進行溝通,獲得準確的地址資料再進行更新。
5.對收報地址庫異常問題,建立相應的排故檢查單,便于下次出現類似問題的及時排故。
四、結論和建議
通過上述兩個案例,可以看到自動化系統數據配置和發布中容易出現故障的幾個因素。隨著民航業的快速發展,要求空管自動化有更高安全性和穩定性為管制提供高效的服務,技術人員應該能熟練地維護系統參數,保證數據的及時性和有效性,在進行自動化系統數據和程序升級中,要保證升級前提前做好測試和預案,升級中按計劃執行,升級后進行數據校對。同時,在分析案例過程中,只有對每一例案例認真剖析、總結,才能在日常工作中遇到類似的情況時及時、準確的處理解決。
參考文獻
[1]鄒金萍,謝曉東.大數據系統和相關技術分析[J].電子世界,2014(24):5.