摘要:高校圖書館各個應用系統中存儲著大量結構化與非結構化數據,對如何解決文獻資源存儲的壓力與日俱增。云計算和云存儲的出現,無疑為圖書館文獻資源的存儲提供了一種嶄新的、較為理想的方法。筆者認為可采用私有云存儲的方式進行數據的存儲,滿足圖書館數據存儲平臺系統的中長期發展的數據存儲需求。
關鍵詞:云計算;云存儲;高校圖書館
中圖分類號:G640 文獻標志碼:A 文章編號:1674-9324(2013)35-0208-02
隨著高校圖書館數字化建設的推進,產生了大量寶貴的數字資源。云計算和云存儲的出現,無疑為圖書館文獻資源的存儲和數據安全提供了一種嶄新的、較為理想的方法。
一、云存儲簡述
云存儲支持兩種實施模式:公有云(Public Cloud)和私有云(Private Cloud)。公有云是由專門機構提供存儲空間,作為一種服務提供給客戶,客戶可以通過支付一定的費用獲得這種服務,從而可以將自己數據通過網絡傳輸并存儲到這些存儲空間中。用戶不需要了解云存儲中使用的技術,也無須為數據的維護和安全性付出任何人力物力成本,這些全部由提供云存儲服務的公司來承擔。私有云是在企業或者相關機構在自己的計算中心或數據中心內部構建的彈性存儲池并由企業或相關機構完全控制。該私有云由管理員進行統一的管理和控制,內部員工通過局域網或是互聯網透明地獲得自己所需的存儲資源。
二、圖書館私有云存儲
無論是公有云還是私有云存儲都需要基于存儲虛擬化技術,并將存儲虛擬化,自動精簡配置,無縫海量擴展以及高冗余技術融合在一起,搭建滿足用戶彈性空間分配和高擴展性需求的存儲系統。由于公有云面對的是所有的用戶,除了上述技術外,還需考慮計費、應用程序接口及安全等多種需求,因此搭建公有云存儲更加復雜。高校圖書館存儲的數據以電子圖書、電子期刊及多媒體文件為主,存儲容量大,對存儲網絡帶寬和延時要求較高。結合高校圖書館數據存儲的擴展性、先進性、高性能和可靠性的要求,按照集中存儲、統一管理的原則,可建立一套私有云存儲系統,滿足圖書館關鍵任務對存儲性能、可擴展性、可靠性的需要。圖書館私有云存儲系統底層利用存儲盤陣作為存儲介質,利用虛擬化技術這些存儲盤陣虛擬為一個存儲資源池,該存儲資源池支持超過10,000個虛擬卷,這些虛擬卷可以分配給不同用戶使用。
三、私有云存儲方案具備的優勢
圖書館私有云存儲具備存儲虛擬化、自動精簡配置、分布式負載平衡以及卷訪問優先級設置等先進技術,可以確保存儲系統的綜合容量得到最大程度的利用,可以充分發揮存儲系統的性能,可以滿足高吞吐帶寬和需要不斷擴展容量的海量存儲應用的需求。整個系統具有以下優勢:
1.存儲虛擬化和自動精簡配置將容量利用率最大化。存儲低利用率一直是圖書館目前存儲方案中一個突出的問題。在直接附加存儲(DAS)中,利用率約為30%,即使把DAS合到一個存儲區域網絡(SAN)中,利用率仍然經常不超過50%。低利用率的一個主要原因是:位于不同物理系統上分散的空閑容量不能整合在一起使用,圖書館如果有新的應用需要添加額外的容量,這必將降低利用率。為了解決這個問題,就需要使用存儲虛擬化技術。存儲虛擬化將多個獨立的存儲系共同合并成一個共享的存儲資源池進行存儲資源的統一規劃,保障存儲容量統一分配,實現最優化的空間利用。存儲低利用率的另一個原因是傳統的應用方式。私有云存儲方案提供自動精簡配置功能來解決利用率的問題。自動精簡配置是一種當數據被寫入時為當前應用分配及時空閑空間的技術,它不存在已分配的但是未使用的空間,所以在很大程度上提高了利用率。這種方法不為某個應用固定一些容量,當發生數據寫入操作時,合并后的容量被動態分配。當總容量被用完,用戶可以立即擴展存儲池,添加的容量將自動被應用程序所使用,通過在線服務可以看到容量的增加。通過在虛擬化架構中實施自動精簡配置功能,私有云存儲可以幫助圖書館各種應用最有效地利用存儲容量。統計數據表明,傳統的存儲系統其利用率一般在50%以下,私有云存儲系統的使用率通常在80%以上。除了可以使未充分使用的數據卷浪費開支最小化外,私有云存儲方案還可以讓圖書館延后購買存儲設備,從而降低了存儲開支。
2.自動性能優化和分布式負載均衡將I/O能力最大化。在傳統存儲架構環境中,因為應用程序在以不同的I/O速率產生數據,數據分布不均使存儲系統的利用率低下。要優化整體性能,管理者必須定期就所需的容量、性能及應用服務級別在硬件資源之間重新分配工作負荷。這項任務需要大量時間、精力和停機時間來完成。私有云存儲方案的架構中,無須任何手動操作就可以輕松實現性能優化。當主機端向存儲池發出一個寫請求,其組成數據塊將以一種平衡的方式分派給各成員存儲系統。當一個新成員系統被加入,數據塊將被遷移確保所有成員平均負載,私有云存儲方案可以確保存儲系統始終處于全力工作狀態從而為他們產生最佳的利潤。
3.卷訪問優先級設置為用戶提供最優的服務。在私有云存儲方案的默認配置中,單套存儲的處理能力會根據各個應用的工作量進行分派。讀/寫請求根據其進入存儲池的順序進行處理,根據這一原則,數據最密集的應用而往往不是關鍵應用可以獲取最強的存儲能力。為了確保根據應用程序的重要性而為其分配適當的資源,私有云存儲系統可設計一種卷優先訪問機制。通過對各個數據卷設置優先級(高、中、低),圖書館管理員根據各種應用讀/寫請求的優先級分別對它們進行順序處理,而不是根據讀/寫請求進入存儲池的順序進行處理。利用這種優先級機制,存儲系統的帶寬資源能夠以最有效的方式進行分配,以滿足應用不同的性能需要。
4.按需二維擴展兼顧性能和容量。在傳統的scale-up架構中,存儲擴展是通過“替代”完成。當單一存儲系統的性能或容量達到上限,用戶必須購買一個新系統以取代舊系統。這種形式的擴展使用戶目前的投資無法得到保護,而且通常花費大量的前期投資在不需要的地方,并且受制于前期的供應商。私有云存儲系統的架構為這些問題提供了一個理想的解決方案。應用私有云存儲系統的二維擴展技術,圖書館需要對存儲進行擴容時可以選擇擴展主機柜或是JBOD來得到I/O性能或是容量的提升。結合上面所述的分布式負載平衡技術,通過簡單的添加,存儲容量或是存儲性能也得到了線性地增長。
5.最高的數據可靠性。對于任何規模的圖書館,無計劃的停機時間都會導致極其惡劣的影響,即使經過長時間的努力,能夠恢復正常的業務運轉,但卻有很多的損失無法彌補。為保護寶貴的信息資源免遭這些意外事件的損壞,私有云存儲系統可提供快照和復制功能,無論存儲系統遭受了邏輯錯誤、物理錯誤還是災難,都可以通過回滾機制確保數據的可用性。私有云存儲系統,具備存儲虛擬化、自動精簡配置、分布式負載平衡及卷訪問優先級設置等先進技術,可以確保存儲系統的綜合容量得到最大程度的利用,可以充分發揮存儲系統的性能,可以滿足高吞吐帶寬和需要不斷擴展容量的海量存儲應用的需求。在云計算的大背景下,相信私有云存儲在圖書館的應用會有廣闊的空間。
參考文獻:
[1]李翠俠.基于混合云的高校圖書館存儲方案研究[J].圖書館學研究,2011,(05):68-71.
[2]周林志.新一代高校信息化建設方式的思考[J].硅谷,2012,(05):132-133.
基金項目:本文系貴州省教育廳高校人文社會科學研究青年項目“基于數據挖掘的圖書館個性化信息服務研究”(項目編號:10QN15),遵義醫學院碩士科研啟動基金項目“基于數據挖掘的圖書館文獻建設決策研究”(項目編號:F-525)研究成果之一
作者簡介:付開遠(1980-),男,碩士研究生,講師,遵義醫學院圖書館技術部主任。