“分布式存儲系統是大量普通PC服務器通過Internet互聯,對外作為一個整體提供存儲服務。”實質是基于軟件實現的存儲服務,屬軟件定義存儲范疇。根據VMware定義“軟件定義的存儲是將工業標準服務器的存儲提供出來并通過軟件控制層面實現存儲的自動化和池化”。
不同的分布式存儲系統適合處理不同類型的數據,可分為四類:分布式文件系統、分布式鍵值(Key-Value)系統、分布式表格系統和分布式數據庫。當前主流的分布式文件存儲產品以Hadoop、GlusterFS、Moosefs為代表。橫向對比分析情況見表1所示。
綜合考量,本文選用MFS作為實例的技術實現,并通過實踐中的優化彌補其弱項。
在獨立二層網絡內,部署六臺普通配置的X86機架式服務器,服務器本地硬盤在100到400GB之間。所有服務器通過一臺低端二層以太網交換機單鏈路互聯,組合成一個總容量1.7TB的邏輯存儲。提供網絡文件系統服務。示意圖如圖1所示。

圖1 實例網絡拓撲圖
集群所有節點服務器位于同一網段,便于管理及部署。Metalogger日志服務器同時作為時間同步服務器及數據存儲服務器。運行情況如圖2所示(不包含元數據節點)。

圖2 實例運行圖
有兩種安裝方式可供選擇:官方軟件庫安裝、源碼編譯安裝。本文采用軟件庫安裝方式。集群軟硬件配置如表2所示。具體安裝步驟為:




表1 分布式文件存儲對比

集群安裝成功后僅需修改少數必要配置文件即可運行,其它配置基本不用修改。……