摘 要:隨著氣象事業的快速發展,業務系統對網絡的依賴程度也越來越高,網絡故障對業務數據的正常傳輸造成極大威脅,要求網絡管理人員必須掌握多種手段,快速查出網絡故障的原因,定位網絡故障點,及時解決問題。文章以舒城縣氣象局一次網絡故障實例為基礎,介紹如何進行故障原因的判斷定位并找出解決的具體方法,從而為臺站的日常網絡管理維護提供參考。
關鍵詞:網絡故障;氣象;舒城
Abstract: With the rapid development of meteorological undertakings, the degree of dependence of the business system on the network is getting higher and higher, The network failure poses a great threat to the normal transmission of the business data. So the network management personnel must grasp the various means,to quickly identify the reasons for network failure、 locate the network point of failure, and solve the problem in a timely manner. Based on the example of a network fault in Shucheng Meteorological Bureau, this paper introduces how to locate and find out the reason of fault, and then provide reference for daily network management and maintenance of station.
Keywords: network failure; meteorology; Shucheng
1 概述
隨著氣象事業的快速發展,地面氣象觀測業務自動化程度越來越高。業務系統對網絡的依賴程度也越來越高,尤其是各項氣象觀測數據必須在規定時效內上傳到省局服務器[1-3]。而網絡故障對數據正常傳輸造成極大威脅[4-6],這就要求網絡管理人員必須掌握多種手段,快速查出網絡故障的原因,定位網絡故障點,及時解決問題。本文以舒城縣氣象局的一次網絡故障實例為基礎,介紹如何判斷故障原因并解決故障的過程。
2 舒城縣氣象信息網絡現狀
目前舒城縣氣象局接通了聯通、電信和移動三家網絡運營商,其中聯通為內網,電信為外網,移動為備份網絡。三家網絡通過一套路由器設備實現互為備份,即聯通和移動只要有一家網絡聯通,則內網仍可保持聯通,電信和移動只要一家網絡聯通,則外面仍可保持聯通。另外,業務系統計算機安裝了3G網絡,作為物理網絡線路故障時,可通過無線網絡傳輸保障觀測數據正常傳輸。
3 故障描述
2017年2月1日(正月初五)凌晨3點業務計算機數據傳輸突然中斷,值班員收到省局信息中心發來的數據未傳輸的手機短信。值班員通過簡單判斷后對計算機和網絡設備分別進行了重啟,故障依舊。
4 故障定位
4.1 內、外網聯通情況
ping內網和外網網關,內網不通,外網正常。對于值班員不熟悉ping命令的情況,可通過查看內網網址(例如ASOM系統、MDOS2系統)和外網網址(例如百度)連接情況加以判斷。僅外網聯通表明聯通和移動網絡均已故障,電信網絡正常,路由器、交換機等網絡設備也應該是正常的。
4.2 重啟設備
先重啟業務計算機,若故障僅因傳輸軟件“死機”可通過重啟恢復正常,若故障依舊再重啟網絡設備。
4.3 排除外力因素
故障發生時單位周邊沒有道路施工現象,與聯通、移動網絡運行商取得聯系,得知近期沒有線路維修維護等施工,表明并非野蠻施工等造成光纜中斷。
4.4 積極尋求網絡運營商協助
在聯通、移動工作人員的協助下,找出機房地板下聯通、移動光纜均被老鼠咬斷,另外移動網絡設備故障。
5 故障解決
經重啟仍無法恢復網絡時,需立即啟動3G網絡,保障觀測數據的正常傳輸。對于業務計算機上未安裝3G網絡的臺站,安徽省氣象局建立了基于互聯網的SSL+VPN線路作為備份通信線路,可實現通過電信外網向處于內網的省局服務器傳輸數據。
在更換好故障的設備和連接好咬斷的光纜后,需對故障修復情況進行檢查。在路由器上將聯通、移動網絡僅保留一路,另一路拔掉,若兩次測試內網均正常則表明網絡故障已解決。
6 結束語
6.1 機房布線應規范合理
放置網絡設備的機房由于線路繁多復雜,布線必須做到規范有序、合理布局。尤其是光纜在接線盒處因沒有了外層的保護,容易遭受鼠咬、扯拽等外力因素的破壞,需加強保護處理。在日常管理和維護中較少涉及到對接口處的查看,一旦出現故障時難以迅速被定位,因此相關的加強保護措施應當規范而且有效。
6.2 強化網絡應急保障
因網絡故障往往對業務造成的影響大,需要每名值班員能夠掌握簡單的故障排除方案,要能在網絡管理人員趕到時進行力所能及的修復,避免事態的進一步惡化,因此在日常業務應急演練中應列入和加大網絡故障修復的應急演練。日常工作中也要加大對網絡設備的巡視巡查,時刻保證3路網絡的聯通,即使有某路網絡故障時不至于造成網絡中斷影響數據傳輸。
6.3 業務人員加強網絡知識學習
除了臺站的網絡管理人員外,每名業務值班人員也應當加強網絡知識的學習,了解網絡設備的常識、故障處理步驟和簡單的診斷分析命令,可以解決一些簡單的網絡故障和加快較難故障的排除速度。
參考文獻
[1]謝筱惠,劉鋒,李旭東,等.淺談基層臺站網絡管理[J].氣象研究與應用,2013,34(3):93-95.
[2]邱勁飚,羅鳳明,張銀河.氣象市、縣網絡中路由器故障的應急解決方案[J].廣東氣象,2006,28(4):66-67.
[3]劉亞玲,王俊,于宏君,等.通遼市氣象信息網絡現狀及安全策略[J].現代農業科技,2012(10):51-53.
[4]趙勇,楊茂春.市級氣象局通訊網絡系統設計與規劃[J].現代農業科技,2010(9):306-307.
[5]楊大軍.自動氣象站通信網絡常見故障及管理維護[J].農業開發與裝備,2015(9):48.
[6]郝利平.地面氣象測報質量影響因素及故障應急處理[J].現代農業科技,2015(7):274.
作者簡介:榮先遠(1987-),男,助理工程師,主要從事地面綜合氣象觀測業務工作。