在VMware vSAN群集中,不用怕一個主機(jī)掉線或死機(jī),也不怕單獨一個磁盤組損壞,更不怕單獨一個硬盤損壞,最怕的是“主機(jī)分區(qū)”。當(dāng)出現(xiàn)分區(qū)時,vSAN存儲會部分或全部不能使用,導(dǎo)致虛擬機(jī)不能啟動或正在運行的虛擬機(jī)死機(jī)。
VMware vSAN群集出現(xiàn)分區(qū)的主要原因有:
1.網(wǎng)絡(luò)問題:這些問題包括vSAN節(jié)點主機(jī)之間,vSAN流量網(wǎng)卡網(wǎng)絡(luò)不通;vSAN見證主機(jī),vSAN見證流量網(wǎng)絡(luò)不通,或vSAN數(shù)據(jù)流量網(wǎng)絡(luò)中斷。
2.版本問題:vSAN見證虛擬機(jī)版本與vSAN節(jié)點主機(jī)版本不一致,主要是vSAN見證虛擬機(jī)版本低于vSAN節(jié)點主機(jī)版本。
3.存儲提供程序脫機(jī)。下面通過具體實例介紹。

圖1 某4節(jié)點vSAN群集拓?fù)鋱D
要檢查vSAN分區(qū)問題,需要先了解vSAN群集節(jié)點主機(jī)數(shù)量,知道每個節(jié)點的管理IP地址、vSAN流量IP地址,最好是根據(jù)拓?fù)鋱D檢查。例如圖1所示為某4節(jié)點vSAN群集的拓?fù)洌疚囊栽撏負(fù)錇槔M(jìn)行介紹。
根據(jù)拓?fù)鋱D,記住vSAN群集中每個主機(jī)的管理地址(例如ESXi41的管理地址 是 172.18.96.41)、vSAN流量VMkernel的IP地址(例如ESXi41的vSAN地址是172.18.93.41)。
1.使 用vSphere Web Client登 錄vCenter,依次檢查每臺主機(jī)的“配置→網(wǎng)絡(luò)→VMkernel適配器”,查看vSAN流量的VMkernel的IP地址以及是否啟用vSAN流量。
2.檢查每臺主機(jī)配置正確之后,使用SSH工具登錄到其中一臺主 機(jī)(例 如 172.18.96.41),使用esxcli vsan network list命令查看啟用vSAN流量的網(wǎng)卡。
3.使用“esxcli network ip interface ipv4 get”命令查看當(dāng)前主機(jī)IP地址配置,得知當(dāng)前主機(jī)有兩個IP地址,分別是172.18.96.41(管理地址)、172.18.93.141(vSAN流量地址)。
4.檢查到其他主機(jī)管理端口的連通性,使用Ping命令,依次Ping其他主機(jī)管理地址,例如:
ping 172.18.96.42
ping 172.18.96.43
ping 172.18.96.44
5.檢查到其他主機(jī)vSAN流量的連通性,使用Ping命令,依次Ping其他主機(jī)vSAN流量地址,例如:
ping 172.18.93.142
ping 172.18.93.143
ping 172.18.93.144
6. 如果第(4)、(5)兩步全部連通,訪問正常,表示vSAN分組不是由于網(wǎng)絡(luò)問題造成的,需要檢查其他原因。……