王小娟



摘要:隨著計算機網絡的快速發展,企業的信息化程度越來越高,企業之間,企業總部與分支機構的網絡傳輸日益重要。如何實現在公共網絡環境下安全、高效和可靠傳輸數據是通訊行業發展的重要課題之一。因此,一般部署關鍵節點的網絡類設備的可靠性至關重要。為了保障網絡類設備能夠連續不間斷地進行工作,要求其具有較高的穩定性和可靠性,為此一般環境中網絡類設備都會采用一種雙機熱備技術。本文重點介紹網絡類設備在熱備環境中的應用場景,通過對該場景的分析,總結一套網絡類設備針對雙機熱備環境適應的測試方法。
關鍵詞:可靠性傳輸;網絡類設備;雙機熱備
中圖分類號:TP393 文獻標識碼:A 文章編號:1007-9416(2020)08-0045-03
0 引言
目前網絡類設備種類繁多,且與日俱增,但是網絡類設備所涉及的環境和場景類的測試工作是由測試執行人員根據個人的技術水平和理解,搭建測試環境來進行功能和業務測試覆蓋,可能會存在:協議和技術分析的不夠深入,測試方法不夠精準,測試需求有待更新、覆蓋不夠全面等問題,需要有新的需求分析和測試方法來支撐測試開展。
在當前的組網應用中,用戶對網絡可靠性的要求越來越高,對于一些重要的業務入口或接入點(比如企業的Internet接入點、銀行的數據庫服務器等)如何保證網絡的不間斷傳輸,成為急需解決的一個問題。于是,業界推出了傳統備份組網方案來避免此風險,該方案在接入點部署多臺設備形成備份,實現一臺設備故障后自動切換到另一臺正常工作的設備,保障部署在關鍵節點的設備的可靠性和穩定性,即雙機熱備技術[1]。
1 雙機熱備概述
雙機熱備可以從兩個層面去理解:一個是廣義的雙機熱備,它是一種解決方案,用來解決網絡中的單點故障問題,它通過數據同步和流量切換兩個技術來實現;一個是狹義的雙機熱備,它是設備支持的一個功能模塊(只實現了數據同步),可以使用對應的Web頁簽來配置。本文描述的是廣義的雙機熱備。
雙機熱備解決方案根據組網情況有兩種工作模式:主備模式和負載分擔模式。在這兩種模式中,設備的角色根據是否承擔流量來決定:有流量經過的設備即為主設備,無流量經過的設備即為備份設備。
2 網絡類設備雙機熱備工作原理
環境部署如圖1所示,其網絡類設備在該熱備環境中的工作原理如下:(1)加電啟動時,兩設備均為備機態;(2)啟動后,根據本地web頁面配置主備機。主機處于工作狀態,能夠處理用戶業務數據。備機處于準備狀態不工作,主備機通過心跳路徑,周期性地發出檢測數據包,實時查詢主機是否工作正常;(3)如果備機在規定的時間內沒有收到來自主機的檢測包后,會認為主機可能出現故障,則備機主動切換為主機,代替主機處理用戶業務數據。
3 現有技術存在的問題
現有的熱備環境測試可能存在的問題有:(1)協議和技術的場景覆蓋不全面,比如協議和技術發展拓寬了知識面,用戶使用場景和需求有變化;(2)每個協議或技術為一個場景,協議的疊加組合及簡化環境設備等方面需要進一步分析和整理;(3)協議和技術是從技術本身出發,而不是從用戶需求和場景出發,需要根據用戶類型和場景分析和固化為用戶場景類的測試環境;(4)協議和技術都是按照環境測試覆蓋,根據網絡類設備的處理方式,只有參與處理的協議才需要如此,另外的丟棄類和透傳類報文可以簡化環境。
4 熱備技術應關注問題
測試網絡類設備在熱備環境中的場景,首先要分析雙機熱備組網應用及切換模式,從根本出發,分析測試需要關注點[2]。
4.1 雙機熱備普通組網應用
兩臺設備,一般是同型號設備,部署雙機熱備模式。雙機熱備普通組網如圖2所示。
4.2 雙機熱備典型組網應用
雙機熱備典型組網應用包含以下幾種:
(1)路由模式+主備模式。雙機熱備典型組網(路由模式+主備模式),是通過VRRP協議實現流量切換。這個需求可以通過在兩臺服務器上配置VRRP備份組1和備份組2(備份組1用來監控下行鏈路,備份組2用來監控上行鏈路),并使能數據同步功能來實現。如圖3所示。
(2)路由模式+負載分擔模式。雙機熱備典型組網(路由模式+負載分擔模式)是通過在4臺路由器和2臺服務器上配置OSPF協議,并在兩臺服務器上使能數據同步功能來實現。如圖4所示。
(3)透明模式+負載分擔模式。雙機熱備典型組網(透明模式+負載分擔模式)是通過在兩臺路由器上配置VRRP備份組1和備份組2(備份組1和備份組2進行負載分擔,共同監控下行鏈路),并在兩臺服務器上使能數據同步功能來實現。如圖5所示。
4.3 雙機熱備切換模式
雙機熱備技術的切換一般分為手動切換和故障切換,即計劃性切換(即人為切換)和非計劃性切換(即故障切換)。搭建熱備環境主要是為了保障設備可靠性,大部分都是因為出現故障切換。
設備工作不正常的情況如下:(1)硬件模塊不正常,比如網口、fpga等;(2)軟件模塊不正常,比如相關模塊、網絡模塊等;(3)環境指標不正常,比如溫度、cpu、內存等;(4)設備本身故障,突然斷電,網絡中斷等[3]。
一般情況下的雙機切換時間為1~5min,而快速切換的時間為3~5s。用戶應根據自己的需求及業務特點來選擇相關的切換服務,因此測試切換過程中需關注切換時長。
5 測試技術關注點
5.1 測試場景關注
為了充分測試的熱備環境適應性,因此需要考慮以上分析到的所有組網應用,覆蓋所有場景。同時測試以上場景的過程中要關注關鍵數據。
5.2 測試數據關注
5.2.1 網絡參數測試包括ARP、STP等信息
(1)ARP信息需關注:網絡設備要能學習到被測設備內網主機的ARP信息;被測設備要能學習到內網主機的ARP信息;內網主機學習到網關的ARP信息。(2)STP信息需關注:交換機關閉STP后,模擬環路數據,在熱備環境中設備自身可以處理環路;開啟STP,驗證熱備工作情況,再關閉后能恢復正常。
5.2.2 數據同步測試
兩臺設備選取主機的條件,主機數據如何準確無誤的傳遞給備機,同步機制。
5.2.3 開機啟動測試
主、備機同時開機,同時啟動(主機工作,還是備機工作),只主機開機,只備機開機。
5.2.4 監控管理測試
被測設備狀態燈監控(設備有狀態燈條件下),主機工作時,狀態燈顯示顏色,備機工作時,狀態燈顯示顏色。
5.2.5 運行狀態切換測試
主、備機切換時間測試,主、備機各類故障切換測試,主機正常,備機故障(備機內口掉線、外,口掉線、關機、相關進程掛起),備機正常,主機故障(主機內口掉線、外口掉線、關機、相關進程掛起),主機正常,拔掉心跳線,確認主、備機工作情況,主機異常,備機正常,拔掉心跳線,確認主、備機工作情況。
6 結語
測試網絡類設備在各種網絡環境時,一是環境本身組網測試,二是設備所處用戶場景測試,兩者必需相結合。且雙機熱備環境測試,不單只測試熱備部署,大部分的實際使用場景是熱備和負載同步部署,因此需要根據用戶環境特點從熱備和負載兩方面分析考慮測試用例。
參考文獻
[1] 趙婷.基于Oracle Data Guard的雙機熱備策略的設計與實現[J].三峽大學學報(自然科學版),2010(6):90-91.
[2] 文麗.淺談雙機熱備份技術在血站的應用[J].內江科技,2013(11):86-87.
[3] 向軍.基于Remus的雙機熱備份優化機制研究[D].武漢:華中科技大學,2013.