黃 燕
(西南政法大學圖書館,重慶 401120)
隨著計算機技術以及網絡技術的飛速發展,各圖書館紛紛投入大量的經費進行數字資源建設,使得數據存儲成為各圖書館亟須解決的一大難題。云存儲的興起,可以有效解決數字圖書館數據存儲這一難題。
近年來,隨著云計算[1]和軟件即服務(SaaS)[2]的誕生,云存儲成為信息存儲領域的一個研究熱點。與傳統存儲不同的是,云存儲不僅僅是一個硬件設備,它是由存儲設備、網絡設備、服務器、應用軟件、公用訪問接口以及接入網等組成的一個系統。[3]云存儲是云計算技術的一個延伸,可以認為它是一個配備了海量存儲空間的云計算系統。提供存儲服務是云存儲的主要功能,通過網絡將本地的數據存放到存儲服務提供商(SSP)提供的在線存儲空間,用戶不需要再花費大量的人力、物力來建立自己的數據中心,只要向SSP進行在線申請,就可以得到存儲服務。這樣可以避免存儲平臺和數據的重復建設帶來的存儲空間的浪費。
與傳統的存儲系統相比較,云存儲具有以下3個特點:1)云存儲面對的是用戶需要的網上海量數據的存儲服務,而傳統的存儲系統只是某一企業為了某一目的而搭建的具有高速計算能力、事務處理能力的數據中心;2)云存儲首先考慮的是數據的安全性、可靠性以及效率等問題,采用加密技術以及身份認證等進行數據保護;3)云存儲不僅局限于提供對傳統文件的訪問,還可以提供對海量數據的管理與維護以及用戶的正常訪問等。
正是由于云存儲具有以上特點,故云存儲的體系結構可以分為以下4個層面,自底向上分別為:數據存儲層、數據管理層、應用接口層和用戶訪問層。具體結構如圖1所示。

圖1 云存儲體系結構圖
(1)數據存儲層。這是云存儲最基礎的部分,是由FC光纖通道存儲設備、NAS和iSCSI等IP存儲設備或SCSI、SAS等DAS存儲設備云存儲組成的海量數據池。這些不同類型的存儲設備分散在不同的地方,云存儲運用廣域網、互聯網、光纖等將其進行物理連接,運用存儲虛擬化技術實現不同型號的存儲設備的兼容,使其成為一個有機的整體,并通過統一的管理邏輯和接口實現存儲設備的集中管理、狀態監控以及管理軟件的升級。
(2)數據管理層。它實現了底層的存儲設備與上層應用的無縫連接,利用群集系統、分布式文件系統、網格計算等技術保證了各個存儲設備之間的有機協同工作,利用內容發布、P2P實現數據的發布與傳輸,利用壓縮技術、數據比對技術對數據進行刪減,利用加密、備份、容災技術來保障數據的安全。
(3)應用接口層。這是云存儲平臺中可以靈活擴展并直接面向用戶的部分。根據用戶需求,可以開發出不同的應用接口。用戶需求不同,應用服務接口也就不同。
(4)用戶訪問層。它由廣大用戶組成,無論在任何地方,只需一臺能聯網的終端機,任何一個授權用戶通過標準的應用接口都可以登錄到云存儲平臺,享受到云存儲提供的數據存儲服務。
云存儲技術是數據存儲領域的核心技術。圖書館是信息搜集、存儲和進行知識服務的機構,圖書館的數據每年呈千萬兆級的趨勢增長,由于缺乏專業的計算機人才對存儲系統進行管理,嚴重影響了讀者方便、快捷地進行信息資源的獲取。云存儲為圖書館帶來了數據存儲的新選擇,為圖書館開展業務工作提供了技術保障,為讀者順利獲取信息提供了穩定的環境。主要表現在以下6個方面。
圖書館每年都要投入大量的資金進行存儲設備的擴容。擴容的方式主要有2種,一種是直接在整列柜中添加磁盤。采用這種方式比較省錢,但是必須購買與原有磁盤品牌、接口、型號等完全相同的磁盤。眾所周知,計算機硬件發展迅速,更新較快,一般兩三年后廠家就不再生產同一類型的硬件了,而且以前的存儲系統無論在傳輸速度以及接口方式上都已經無法滿足數據存儲的需求,所以這種方式采用得并不多。另一種方式是購買新的存儲系統。采用這種方式資金投入比較大,大多數圖書館很難承受。而云存儲系統對存儲設備、服務器設備、硬盤等產品的一致性并沒有要求,不同介質、容量、廠牌、型號的硬盤,利用存儲虛擬化技術都可以一起協同工作,既可以實現原有硬件的利舊保護投入,又可以實現新技術、新設備的快速更新。
目前每一個數字圖書館都需要配備專門的計算機專業人才對服務器、存儲系統進行日常管理和維護,由此會產生一定的人員成本和技術成本。專業技術人員需要了解不同商家的不同存儲系統的使用情況,工作難度較大。在硬盤或是存儲服務器損壞時,數據丟失的可能性也很大。而云存儲則沒有這些困擾,硬盤壞了不需要立即更換,數據會自動遷移到別的硬盤,從而大大減輕了管理人員的工作負擔,避免了由于數據丟失而造成的損失。
云存儲的用戶群體龐大,需要具有專業知識且經驗豐富的技術人員對存儲系統進行管理與維護,圖書館只需要提出自己的訪問數量、使用時限以及服務項目等情況,存儲提供商再根據服務項目進行合理收費。圖書館還可以根據資金承受能力隨時提出需求變換,真正做到“按需使用”。
云存儲可以近乎完美地避免“數據庫不能正常訪問”等問題的發生。云存儲是將文件和數據保存在不同的存儲節點上,它知道文件的存放的位置,當發現某一文件不可訪問時,系統會自動將讀寫指令發送到另外一個服務器上的文件,使服務持續進行。
圖書館之間可以達成協議,將數據都提供給同一個SSP進行存儲與管理(也就是不同的圖書館將自己的數據放到同一個數據池中),SSP就會給協議內的圖書館授權,從而實現不同圖書館之間的數據共享。對于參加合作的圖書館來說,在云存儲系統中,通過云計算技術,他們可以實時地獲得其他圖書館的資料,使用戶的信息需求獲得極大滿足。[4]
目前,許多圖書館都購買了自己的存儲系統和相同的數字資源,這就造成了相同數據的重復存儲。云存儲通過光纖、廣域網將分布在各地的存儲設備連接起來,通過存儲虛擬化技術進行集中管理,當不同的圖書館提供給SSP的數據重復時,云存儲會通過數據管理層對重復數據進行刪除。
毫無疑問,云存儲可以很好地解決圖書館存儲空間與日益增長的數據量之間的矛盾,節省了圖書館的經費開支,為圖書館之間的信息共享起到推動作用。但是,如果圖書館將全部數據都托付給SSP,也會在技術、版權保護等方面出現問題。
雖然在國外云存儲已經有了很多成熟的案例,如由JISC資助的項目Fedorazon[5]解決了大規模倉儲所面臨的數據量不斷增長和復雜度不斷增加的問題;DuraSpace發起的 DuraCloud[6]擴展了多個云存儲平臺,并力圖解決在不同平臺間的數據遷移。而國內云存儲技術發展比較遲緩,僅停滯于理論研究階段。國外的實踐表明,云存儲的訪問對網絡的傳輸速度要求很高,就目前的網絡環境而言,如果執行大規模數據請求或數據恢復操作,云存儲是否可以提供足夠的訪問空間以及所有站點的中心設備的高速響應是云存儲亟須解決的問題。在未來,當網絡環境得到優化后,或許云存儲廠商可以提供一套組件,在完全本地化的系統上來模仿云地址,讓本地NAS網關設備繼續正常運行而無需重新設置,數據傳輸將更加迅捷。如此一來,即便是客戶的本地數據發生了災難性的損壞,云存儲廠商也可以將數據重新快速傳輸給客戶數據中心。
云存儲采用商業模式來運作,用戶需要根據服務時間、服務內容來付費。孫衛[7]分析了6種主要云存儲商類型,總結出3種商業模式:1)以商業銷售硬件、軟件幫助客戶建立云計算環境的商業產品模式,以IBM、SUN、微軟為典型代表;2)以互聯網運營商提供免費服務獲得更多廣告的云的支撐模式,以谷歌、亞馬遜、微軟為代表;3)為有商業價值的傳統行業專門服務并收費的云的支撐模式。眾所周知,圖書館是公益性的服務機構,商業模式的開展會受到一定的制約。如何在享受云存儲服務商提供服務的同時,避免受到云存儲服務在價格方面的制約,是圖書館要解決的一個問題。
圖書館應該有選擇性地將部分資源托管給SSP,在日常業務和管理環節中局部地應用一些專業的云服務商提供的服務。[8]此種模式國外已開先河,如哥倫比亞區公共圖書館正在使用Amazon的EC2服務托管它們的網站,圖書館聯盟OhioLINK正在使用Amazon's Web Services托管一小部分它們的數字公共資源。國內的圖書館聯盟應號召成員館將有價值的、無版權糾紛的數字資源部分托管給SSP,在SSP提供的平臺上進行數據共享,這樣每一個成員館都能做到用最小的投入獲得最大的收獲,充分實現利益最大化。
云存儲在很大程度上弱化了圖書館的數據庫維護、存儲系統維護等IT功能,也可以說減小了數字資源管理人員的工作難度和強度。未來的圖書館應利用云存儲的強大計算能力、海量存儲能力,考慮增強新的業務功能,尋求新的定位。特別是在數字資源的選擇、評價、分析、整合上,利用數據挖掘及知識發現工具,為用戶在云存儲的數據池中利用信息資源提供指導依據。
[1]Hayes B.Cloud Computing[J].Communications of the ACM,2008,51(7):9-11.
[2] Laplante P A,Zhang J,Voas J.What's in a Name?Distinguishing Between SaaS and SOA[J].IT Professional,2008,10(3):46—50.
[3]王慶波,金 涬,何 樂,等.虛擬化與云計算[M].北京:電子工業出版社,2009:10—20.
[4]永 先,欒旭倫,李森森.圖書館迎來“云”時代[J].高校圖書情報論壇,2009(3):59—62.
[5] Fedorazon[EB/OL].[2010-04-20].http://www.ukoln.ac.uk/repositories/digirep/index/Fedorazon.
[6]DuraCloud[EB/OL].[2010-04-20].http://www.duraspace.org/duracloud.Php.
[7]孫 衛.圖書館在云時代的思考[J].數字圖書館論壇,2009(6):35—41.
[8]圖書館云地圖:云計算和存儲指南[EB/OL].[2009-07-22].http://www.yeeya n.com/articIes/view/100748/58660.