■河北 王曉洲 王春海
在vSAN群集中,如果出現了“vSAN運行狀況警報‘再次出現主機故障后’”的提示,如圖1所示。出現這種故障的原因是:
假設當前群集中一臺主機出現故障,故障主機上的數據在其他主機重建之后,主機數據存儲使用情況高于75%。可以在vSphere Client的導航窗格中選擇數據存儲,在右側“配置→更多→警報定義”中查看這一定義。
可能通過進一步檢查查看當前vSAN群集中每臺主機磁盤組容量、已用容量。在vSphere Client中,在導航窗格中選擇vSAN群集,在“監控→vSAN→物理磁盤”中查看每臺主機磁盤組容量、已用容量、預留容量,如圖2所示。
將查看到的每臺主機空間使用情況數據記錄整理,并計算每臺主機的可用容量,如表1所列。

圖1 vSAN運行狀況警報

圖2 查看每臺主機空間使用情況
在當前情況下,使用空間最多的是IP地址為172.16.12.1的主機。如果172.16.12.1出現故障,這個主機上已用容量5.18TB,會在另外3臺主機重建,假設每臺主機平均分配三分之一的容量即1.73TB,則每臺主機剩余容量如表2所列。
根據圖2的數據存儲定義來看,如果每臺機不出現黃色的報警,每臺主機的可用容量應該=7.64×(1-75%)=1.91(TB);如果不出現紅色的報警,每臺主機的可用容量應該=7.64×(1-85%)=1.146(TB)。但現在每臺主機可用容量分別為0.67TB、0.81TB、0.80TB,已經達到紅色報警級別。所以這是出現圖1所示警報的原因。對于這種情況,解決的方法無非是以下兩種:
1.刪除不使用的虛擬機,刪除不需要在vSAN存儲中保存的文件,釋放vSAN存儲空間。
2.對當前vSAN進行擴容。擴容的方式可以是橫向擴容、縱向擴容。橫向擴展是向當前vSAN群集添加節點主機。縱向擴容是擴展每臺主機的容量,可以向每臺主機磁盤組添加容量磁盤,也可以添加新的磁盤組。但在當前的vSAN群集中,每臺主機有1個磁盤組,每個磁盤組有1塊緩存磁盤、7塊容量磁盤,已經達到一個磁盤組的上限,所以當前主機可以再添加1個磁盤組。

表1 當前vSAN群集每臺主機容量記錄

表2 172.16.12.1主機故障后數據重建后的可用容量