◇開封市氣象局 霍繼超
河南省氣象災害防御技術中心 孫 欣
網絡技術的普遍應用有力提高了氣象服務質量水平,但網絡運行中出現的故障也越來越多樣化,可表現為一個故障現象有多種原因,多個故障現象只有一個原因,所以診斷和排除工作相對復雜。本文綜合筆者工作實例,分析歸類氣象業務網絡運行種的不同種類,且給出相應解決辦法,以供參考。
氣象業務網絡是實現氣象、氣候、衛星、觀測、信息網絡等氣象業務系統的中樞和紐帶、是現代氣象業務體系的基礎支撐,氣象資料為各種天氣預報服務產品提供依據,是做好糧食安全、生態安全等氣象保障的基礎數據資源,而氣象資料的傳輸存儲載體是氣象業務網絡。局域網應用在氣象業務中會出現某些突發故障,這就需要及時檢測和排查,盡快定位故障位置和原因,冷靜妥善處理問題。
氣象業務網絡的物理故障是硬件設備故障導致網絡無法正常使用。原本能正常通信的電腦終端無法與交換機相連接時,可以用網絡線儀測試線路,各信號燈顯示連接正常但在末端接入另一網絡交換機實現信號放大情況下數據通信才恢復正常,這種現象一般是因線路阻值發生變化導致網絡通信異常。利用萬用表對計算機接入端口測量,發現期信號電平值低于正常通信狀態下電平值,再用萬用表對每對線檢測,會出現線纜阻礙交流電流作用部分值偏大,此時打開墻壁模塊盒并檢查接合處,發現因墻壁受潮導致網絡模塊上卡線刀片氧化情況嚴重,尤其是線纜接觸點,更換網絡模塊后即可恢復正常。計算機之間的連接出現時斷時續,而主控制臺和主機連接無問題,發現雙絞線有破損,更換新的雙絞線即可。因線路遭受物理破壞而導致線路中斷,可采用網絡測線儀對雙絞線接頭測試,必要時以雙端雙絞線離開線架水晶頭直接確診,沿網絡路由人工查找故障點,線路斷開點以銅芯一一對應纏繞連接后以焊接方式外包密封處理,或將芯線解開分別壓制進水晶頭后用對接模塊連接。若無法查找斷電或焊接則在保證芯線不大于4根情況下調整芯線順序,保證信號傳輸,在具備條件時重新布設雙絞線,但比較繁瑣耗時。
在氣象網絡中,網卡是上網通行的第一道手續,一旦網卡設置沖突,電腦會拒絕登錄信息。網卡與網速不匹配會造成自適應網卡不能應用于氣象網絡,網卡和交換機自適應模式不相兼容則網卡速率無法被識別,安裝網卡前需確認與網卡相接的交換機端口速率值。安裝具有網絡喚醒功能的網卡后計算機可能會死機,一般是WOL線沒有正確連接,拔下WOL線即可。機房內計算機會出現PING不通現象,但網卡和主板均無問題,可能是計算機周邊存在強大電磁干擾,也可能干擾源來自計算機內部,檢查機箱內部網卡是否同其他擴展卡安裝距離過近,其中顯卡和獨立聲卡最易干擾網卡。安裝網卡后整個局域網連接時斷時續而且上網速度變慢,而內部顯卡、聲卡和主板等均無問題,則考慮計算機電源故障導致網卡無法正常工作,產生的放電干擾信號會影響網卡輸出端口,進入網絡后占用大量重發幀和無效幀進而干擾網絡運行,解決方法是更換電源。
對于星型拓撲結構而言,集線器是整個網絡中樞指揮,一旦集線器出現故障則波及整個網絡無法工作。氣象信息傳輸時明顯感到速率較慢,比如集線器連接的是10Mps以太網,但傳輸速率只有700~800 kb/s,排除計算量的方式,網絡無法達到標準速度原因主要有三:第一是集線器自身限制,若共享寬帶為20Mps,所有端口均處于通信狀態,每個端口得到的傳輸速率必然無法達到極致,必須用交換機作為集線設備。第二是網卡原因,網卡質量較次則發出的數據通信包會出現錯誤,一旦有誤必會重發,出現錯誤過多拷貝文件速度自然下降。第三是網線原因,信號衰減度會隨網線長度增加而增加,或距離雖近但網線質量不好也無法達到理論值。出現Internet和局域網都不正常,此種故障原因可能有三:一是路由器死機,重啟即可;二是交換機故障,某些交換機也會出現偶爾假死導致網絡癱瘓,重啟計算機即可;三是網絡連接錯誤造成的,檢查發現某一集線器連接出現問題,此集線器級聯是兩個端口,需人工根據相連交換設備端口接到中一個,另一個則連到計算機,這兩個端口均是以太網端口,不同的是輸出和輸入對線位置改變。再者,連接路由器的線纜破損或計算機被病毒感染都會導致故障。
在規劃氣象局域網時,考慮到多媒體傳輸需要使用兩個速率不同的自適應交換機作為集線設備,在組建局域網時發現計算機之間無法通信,但交換機連接并無錯誤提示。此時先將交換機的線全部卸除,以網線測試儀檢測交叉線通否,若每一根都通則依次把線插好。再于計算機之間執行PING操作,仍然無法接通。則觀察交換機Uplink接口,做兩根直通線測試無誤后將一臺交換機Uplink端口和另一臺交換機普通端口連接就會接通。
一個有權限的堆疊矩陣模塊、堆疊接口模塊或堆疊表會導致交換機堆疊起后網絡變緩慢,此時需改變堆疊模塊。當為了實現快速以太網通道的功能將兩臺交換機兩對端口以兩條線同時相連卻發現每個交換機僅一個端口正常,另一個顯示紅燈。這是因為兩端口相連導致交換機認為是循環存在,便會斷掉其中一根將其相應端口關掉則顯示紅燈,此時秩序打開Spanning tree,讓交換機認為這個端口是FEC功能,在邏輯上是一個端口即可。
路由器作為氣象網絡中重要的節點設備處在OSI模型中的第三層,其利用網絡層定義的邏輯上的IP地址來分辨不同類型的網絡,以實現網絡間的互聯和隔離,保持網絡獨立性。常見路由器故障有兩種:一是網絡擁堵,氣象資料無法及時傳輸,一般市局路由器配置兩個快速以太網通道口和一個以太口,兩個快速通道口對接內部局域網和所轄縣級氣象局,一個以太口對接省氣象局,縣氣象局則有一個快速以太網通道口和一個以太口,快速以太口對接內部局域網,以太口對接市氣象局。隨著氣象服務精細化推進,需展示在網絡上的資料越來越多,端口配置錯誤會造成網絡堵塞,此時應按照正確方法配置各接口,同時爭分奪秒恢復正常網絡功能,可將對下級站的計算機設置為本級IP地址,如為市氣象局布置網絡格局時,酌情將本網段最后幾個IP地址作為備用IP地址,當縣站路由器故障時,利用測報用、通信用、自動站采集用計算機收集資料,將傳輸用機IP地址變為市局備用IP地址,網關改為市局路由器地址,將本級端口本來與VLAN端口聯接的雙絞線改接到交換機其他不用端口上,此時下級站計算機則被是為本級遠程終端,即可順利實現上下級網絡互聯。二是路由器死機,當縣氣象局無法通上省氣象局網絡,遠程登錄市局路由器不能運行查看命令則可能是路由器自身軟件有BUG,導致運行時系統資源被無端消耗無法有效釋放最終內存耗盡無法處理轉發請求。解決方法是遠程登錄至故障路由器,輸入“reboot”命令符重啟,需注意輸入命令符前不能執行其他任何操作,否則可能會喪失與主機聯系。
保障氣象網絡順暢運行是確保高質量氣象服務的前提,需要技術人員在日常工作中多注意經常出現的典型故障和非典型表現,分析出背后的原因,以便在日后出現類似問題時快速處理,不延誤氣象資料傳輸。