元紹華
摘要:雙活數據中心能夠有效提升數據中心的資源利用率,并在更高層次上提高業務連續性保障能力。但雙活數據中心的構建是一個系統性工程,實現起來較為復雜。本文介紹了一種基于vSphere FT技術在雙數據中心實現業務雙活的通用方法,列舉了其優勢和局限性,最后給出方案實施的建議。
關鍵詞:雙活數據中心;vSphere FT
1.引言
近年來,信息化技術在促進業務質效提升方面發揮著越來越重要的作用,企業對數據中心的RTO和RPO也提出了更高的要求,雙活數據中心建設逐漸成為熱門話題。嚴格來說,關于雙活數據中心的定義,目前業界還沒有統一的標準和規范,現有的定義主要是一些廠商從基礎架構角度提出的理念,最終都體現為業務連續性和資源利用率的提升。
2.vSphere FT簡介
VMware Fault Tolerance是VMware保護虛擬機可用性的一項功能。針對被保護虛擬機——主虛擬機,通過在集群內另外一臺主機上創建和維護與之完全相同的輔助虛擬機,提供比HA更高級別的業務連續性保障。
正常情況下,vSphere平臺通過一定機制,實時將內存數據在內的所有信息同步至輔助虛擬機。當主虛擬機所在主機發生故障時,輔助虛擬機立刻成為主虛擬機并接管業務,同時在其他可用主機上新建輔助虛擬機,整個切換過程RPO和RTO為0。
3.方案基本原理
二層網絡打通的情況下,通過在雙數據中心搭建跨站點的vSphere集群架構,將不同業務虛擬機分散至雙數據中心同時對外提供服務,開啟被保護虛擬機的FT功能,并指定輔助虛擬機所在數據中心,從而實現業務級數據中心雙活。
4.主要做法
一是檢查網絡環境,以滿足跨站點FT對網絡的要求,具體包括兩個數據中心間的10Gbit鏈路、二層網絡互通等;二是調整虛擬化平臺的部署,在兩個數據中心分別構建ESXi集群和存儲虛擬化,配置存儲對本數據中心及對端數據中心集群可見;三是調整關鍵業務虛擬機的資源配置并部署于主數據中心虛擬化平臺,以滿足FT對單主機保護虛擬機數量的限制,可利用vCenter Operation Manager獲取關鍵業務虛擬機的實際資源需求,進而對其配置進行調整;四是進行FT相關配置,包括開啟HA、指定輔助虛擬機所在主機等。
5.方案評價
嚴格意義上的數據中心雙活包括網絡雙活、應用雙活和數據雙活等,除網絡雙活技術已發展較為成熟外,其他方面都還處在發展完善階段,且存在“腦裂”、性能下降等風險。
相比之下,本文所提方案具有以下優點。
成本低廉:硬件要求與其它數據中心雙活解決方案類似,但該方案基于vSphere自帶功能實現,無需購買額外的軟件產品。
架構簡單:依托網絡雙活技術,基于vSphere平臺環境運行,不需要對現有應用、數據庫進行改造。
運維簡便:類似于常規的虛擬化運維,不存在“腦裂”、性能下降等風險。
5.1.局限性
目前,vSphere FT功能仍處在一個持續完善的過程中,在諸多方面有一定的局限性。
5.1.1. 基礎硬件設施要求高
主要體現在:主機中用于容錯虛擬機的CPU必須與vSpherevMotion兼容,并需要CPU支持硬件MMU虛擬化;需要使用10 Gb日志記錄網絡并確保網絡延遲時間非常短。
5.1.2. 軟件許可限制較嚴格
群集中的主機上允許的最大容錯虛擬機數量為4,并且主虛擬機和輔助虛擬機均計入此限制;跨主機上所有容錯虛擬機聚合的最大vCPU數量為8,主虛擬機和輔助虛擬機中的vCPU均計入此限制;最高級別的vSphere版本,單個容錯虛擬機支持的vCPU數量最多為8。
5.1.3. 不支持vSphere部分功能
開啟FT的虛擬機不支持vSphere部分功能,主要包括:不能對已啟用FT的虛擬機執行快照;支持為vStorage APIs - Data Protection (VADP)備份而創建的僅磁盤快照,但舊版FT不支持VADP;不能為已啟用FT的虛擬機調用 Storage vMotion;不能在為鏈接克隆的虛擬機上使用Fault Tolerance,也不能從啟用了FT的虛擬機創建鏈接克隆;不支持磁盤加密、虛擬卷數據存儲、基于存儲的策略管理、 I/O 篩選器、TPM、啟用VBS的虛擬機、UPIT。
5.1.4. 不兼容虛擬機部分功能和設備
開啟FT的虛擬機不能兼容虛擬機部分功能和設備,主要包括:物理裸磁盤映射、由物理或遠程設備支持的CD-ROM或虛擬軟盤設備、USB和聲音設備、N_Port ID虛擬化(NPIV)、網卡直通、熱插拔設備、串行或并行端口、啟用了3D的視頻設備、虛擬EFI固件、虛擬機通信接口(VMCI)、2TB+VMDK。
6.最佳實踐
6.1.主機配置
運行主虛擬機和輔助虛擬機的主機應當按照與處理器大致相同的頻率運行,否則輔助虛擬機可能會頻繁地重新啟動。
6.2.主機網絡配置
按照一定規則配置主機網絡,以便在不同流量類型的組合和不同數目的物理網卡的情況下支持FT。
6.3.同類集群
構建群集時,所有主機都應具有以下配置:對虛擬機所用數據存儲的一般訪問權限、相同的虛擬機網絡配置、所有主機相同的 BIOS 設置。
6.4.性能
要為主虛擬機和輔助虛擬機之間的日志記錄通信增加可用帶寬,須使用10千兆位網卡,并允許使用巨幀。
6.5.在共享存儲上存儲 ISO 以連續進行訪問
對于啟用了FT的虛擬機,其所訪問的ISO應存儲在可以供容錯虛擬機的兩個實例訪問的共享存儲上。
6.6.避免網絡分區
當vSphere HA群集出現管理網絡故障,導致某些主機與vCenter Server隔離并且使這些主機彼此隔離時,會出現網絡分區,有可能降低FT保護。
7.結語
vSphere FT技術通過創建和維護與主虛擬機相同、且可在故障發生時隨時切換的輔助虛擬機,提供了較HA更高等級的業務連續性保障能力。從vSphere最近版本中對FT功能的更新情況可以看出,FT技術仍然處在不斷發展進步的過程中,通過合理利用,有望形成一套更為成熟、簡單可靠的雙活數據中心解決方案。