張 超
(大慶油田信息技術(shù)公司北京分公司,北京 100043)
信息時代之下,隨著網(wǎng)絡(luò)技術(shù)的不斷成熟,如何通過網(wǎng)絡(luò)來形成一個相對較大的資源池,并且進一步實現(xiàn)對于相關(guān)資源的優(yōu)化利用,成為當前該環(huán)境下共同的關(guān)注重點。而對于存儲領(lǐng)域而言,同樣存在類似的發(fā)展趨勢,集群存儲技術(shù)已經(jīng)成為當前發(fā)展的重要方向,并且從需求的角度看,其存在也必然會在未來煥發(fā)出獨特的生命力。
集群存儲技術(shù),從概念的角度看,就是由物理上分散的多個通用存儲設(shè)備通過網(wǎng)絡(luò)共同組成的,用于存儲的集群體系。整個集群存儲體系通過網(wǎng)絡(luò)保持聯(lián)系,并且由相應(yīng)的管理系統(tǒng)展開控制,實現(xiàn)對于整個集群環(huán)境中整體存儲能力的提升與優(yōu)化。
在實際的工作系統(tǒng)發(fā)展過程中,集群是作為本地存儲系統(tǒng)能力限制以及利用率不足同時出現(xiàn)的一種有效解決方案。在其應(yīng)用環(huán)境中,主要價值體現(xiàn)在負載均衡、分布式操作以及良好的擴展彈性三個主要方面。其中負載均衡,即集群存儲通過相應(yīng)的系統(tǒng)控制,來實現(xiàn)在整個體系環(huán)境中的負載均衡,通過相應(yīng)的算法和策略,將來源于用戶的訪問以一種更為合理的方式分散到不同的存儲節(jié)點上,同時通過開放式的架構(gòu)和后端網(wǎng)絡(luò)實現(xiàn)數(shù)據(jù)存儲的格局優(yōu)化。而這一切,都需要分布式操作系統(tǒng)的有效支持,其負責面向整個集群存儲體系實現(xiàn)管理,并且考慮到需要面向分散的用戶群體提供具有針對性的服務(wù),該種操作系統(tǒng)同樣選用分布式作為主要實現(xiàn)方式,多個節(jié)點之間并行工作,雖然在算法和同步方面會帶來額外開銷,但是性能方面卻可以得到進一步的提升。最后,在開放性特征方面,主要是考慮到當前工作環(huán)境本身都呈現(xiàn)出的越來越強的彈性特征,因此會要求集群存儲體系能夠支持面向存儲節(jié)點、前端網(wǎng)絡(luò)以及后端網(wǎng)絡(luò)實現(xiàn)多個層面的開放支持。同時這種開放特征,對于系統(tǒng)本身的成長而言同樣具有積極價值
依據(jù)工作原則以及系統(tǒng)結(jié)構(gòu)的不同,集群存儲系統(tǒng)可以分為對稱式集群存儲體系和非對稱式集群存儲體系兩種。在對稱結(jié)構(gòu)環(huán)境中,所有的存儲節(jié)點都存儲有磁盤結(jié)構(gòu)的全部信息,因此每一個節(jié)點都可以獨立提供元數(shù)據(jù)的相關(guān)訪問服務(wù),而元數(shù)據(jù)的管理和同步則通過網(wǎng)絡(luò)和分布式控制體系加以實現(xiàn)。該領(lǐng)域中的典范包括IBM的GPFS(General Parallel File System)以及Red Hat的GFS(Google File System)。而非對稱式集群存儲體系則是由一個或一組專用元數(shù)據(jù)服務(wù)器展開對于文件系統(tǒng)和磁盤結(jié)構(gòu)的維護和管理,所有的服務(wù)提供只能由這樣一組服務(wù)器提供。在該領(lǐng)域環(huán)境中,典范產(chǎn)品包括Panasas的PanFS以及Lustre的Cluster FS(Cluster File System)等。
在對稱結(jié)構(gòu)的集群存儲系統(tǒng)中,GPFS由Tiger Shark發(fā)展而來,一直以來以其高性能和良好的彈性著稱于世,并且在可用性方面也有不俗表現(xiàn)。但是GFS作為開源的典范,同樣受到一貫的關(guān)注,其能夠?qū)nix語義和POSIX標準實現(xiàn)良好支持,能夠通過日志實現(xiàn)客戶節(jié)點失效的快速恢復,支持采用設(shè)備端的數(shù)據(jù)塊級的分布式鎖機制來對文件讀寫進行同步。
圖1為其框架示意圖。

圖1 GFS體系結(jié)構(gòu)示意圖
進一步從軟件實現(xiàn)的角度看,GFS體系中的全局文件系統(tǒng)采用C/S方式加以實現(xiàn),客戶端需要承擔操作系統(tǒng)與VFS層的接口實現(xiàn),并且提供標準文件系統(tǒng)操作支持。其客戶端的邏輯結(jié)構(gòu)參見圖2。

圖2 GFS客戶端邏輯結(jié)構(gòu)示意圖
在客戶端,GFS的文件請求均由服務(wù)器來實現(xiàn)。當出現(xiàn)大量頻繁的數(shù)據(jù)請求的時候,為了避免數(shù)據(jù)環(huán)境中過大的系統(tǒng)資源開銷,文件讀寫系統(tǒng)會提供一個旁路緩沖標志,在該標志的指引下,數(shù)據(jù)可以不需要緩沖直接送達服務(wù)器。對應(yīng)的服務(wù)器端的邏輯結(jié)構(gòu)參見圖3。

圖3 GFS系統(tǒng)服務(wù)器端邏輯結(jié)構(gòu)示意圖
在服務(wù)器端,GFS服務(wù)器中的服務(wù)線程接收用戶的文件請求,而后請求觸發(fā)硬件終端,并且由系統(tǒng)喚醒等待的線程來處理這個請求,并且將對應(yīng)的輸出結(jié)果進行發(fā)送。
在分布式集群存儲技術(shù)環(huán)境中,多種產(chǎn)品競相發(fā)展,不同的技術(shù)均具有不同的應(yīng)用特征,并且在實踐的過程中呈現(xiàn)出對應(yīng)的適用性。針對此種狀態(tài),實際中必須針對實際情況展開全面而深入的分析,并且切實了解不同的集群存儲特征,才能實現(xiàn)有效選擇。
[1]Schmuck F, Haskin R. GPFS:A Shared-disk File System for Large Computing Clusters.Proc.of Conference on File and Storage Technologies, 2002-01-28.
[2]Preslan K W, Barry A, Brassow J. Scalability and Failure Recovery in a Linux Cluster File System.USENIX Association, 2000.