摘要:信息時代,作為信息資源中心的圖書館面臨著與日俱增的數據存儲與管理問題,云計算的出現將圖書館的數據存儲帶來新的思路,圖書館可以借助云計算的分布式數據存儲技術和相關的虛擬化技術來實現數據的存儲與管理,從而實現更為智能、高效和可靠的數據存儲。
關鍵詞:數字圖書館;云計算;數據存儲
中圖分類號:G250.7 文獻標識碼:A 文章編號:1674-9324(2012)07-0194-03
一、云計算給數字圖書館數據存儲帶來的變革
云計算時代中,IT資源的應用前景將會變得象電力應用一樣,通過互聯網就能隨時使用并按照使用量來計費。云計算是一種全新的計算方式,在這種方式中,通過互聯網,將大規模且具有可擴展性的IT相關功能作為服務提供給多個外部用戶,云計算將為數字圖書館的建設帶來如下優勢:第一,圖書館只需連接到互聯網就能使用云計算的相關服務,減少了數字圖書館在IT建設方面的投入以及后期維護成本。第二,可以讓數字圖書館更加專注于自己的核心業務建設,充分發揮信息技術應用于圖書館領域的效益,提供更加優質的服務。第三,相對于傳統數字圖書館費時費力去購買和安裝服務器搭建應用服務來說,云計算賦予數字圖書館更大的靈活性,以快速應對讀者需求的變化。第四,根據云計算的性質,云服務提供商可為數字圖書館提供災難恢復功能,因為很多圖書館并沒有將災難恢復構建到自己的數字圖書館建設中去。
二、認識云時代數字圖書館對數據存儲的挑戰
云計算是一項正在興起中的技術,它的出現有可能完全改變用戶現有的以桌面為核心的使用習慣,而轉移到以Web為核心,使用Web上的存儲與服務。數字圖書館的建設也可能因此迎來一個全新的云時代。首先,云計算和數據存儲之間需要權衡的問題就是功能和開發成本,目前云計算提供的API比傳統數據庫系統的限制多很多,只提供了極小化的查詢語言和有限的一致性保證。其次,易管理性在云計算中也極其重要,這也帶來了新的挑戰。和傳統的系統相比,受負載變化幅度大以及多種多樣的共享設備等因素的影響,在云計算中管理任務將更加復雜。然后,云計算和云數據存儲的龐大規模也同樣帶來了新的挑戰,現有的SQL數據庫無法簡單地處理放置在云中的成千上萬的數據。最后,隨著云計算的流行,預計會有越來越多的云應用場景出現,也將帶來新的挑戰。例如,未來可能會出現一些預載大量數據集(比如網絡檢索)的云服務,這樣就需要從異構數據中提取有用的信息,也表明跨“云”服務可能出現。從上述可以看出,雖然云計算及其數據存儲在適當應用中具有很大優勢,但同時也面臨很多技術難題需要解決。另外,數字圖書館進入云時代也需要考慮幾個方面的問題:首先是其數據存儲產品是否能夠提供數據屏蔽,當數字圖書館采用云存儲數據的時候,是否可以屏蔽敏感數據,需要數據取回時,可以解除屏蔽,這將確保關鍵數據只能由授權用戶讀取而免遭非法用戶竊取。其次是否具備歸檔不活躍數據來改善網絡延遲的功能,這將在一定程度上抵消網絡延遲時間。
三、根據數字圖書館自身情況選擇數據管理模式
從技術本質上講,云計算是網格計算(Grid Computing)、分布式計算(Distributed Computing)、并行計算(Parallel Computing)、效用計算(Utility Computing)、網絡存儲(Network Storage Technologies)、虛擬化(Virtualization)、負載均衡(Load Balance)等傳統計算機和網絡技術發展融合的產物,云計算至今沒有一個確切的定義,可以說每個人對云計算都有自己的認識。雖然云計算沒有一個統一的定義,但云計算的分類還是比較標準的,根據服務模式把云計算分成:基礎設施即服務(Iaas),平臺即服務(Paas)和軟件即服務(Saas);根據部署方式可以分成公有云、私有云以及混合云。公有云是指由專業的服務商建立IT基礎設施直接向外部用戶提供服務的有云,外部用戶通過互聯網訪問服務,并不擁有云計算資源,目前典型的公有云有亞馬遜的AWS、微軟的Windows Azure平臺等。對于使用者來說,公有云的最大優點是其所有的應用程序、服務及相關數據都存放在公有云上,使用者無需做相應的投資和建設。而最大的問題則是由于數據不存儲在自己的數據中心,其安全性存在一定風險。同時,公有云的可用性不受使用者控制,這方面也存在一定的不確定性。私有云通常指為一個客戶單獨使用而構建的云,圖書館可以根據自己的需要搭建IT基礎設施,面向讀者提供云計算服務,圖書館擁有基礎設施的自主權,并且可以基于自身的需要改進服務,進行自主創新。相對于公有云,私有云部署在圖書館內部,因此其數據安全性、系統可用性都完全由圖書館自身控制,私有云可以由圖書館自身的技術部門,也可以由云服務商進行構建?;旌显?,顧名思義是公有云、私有云的結合。公有云、私有云、混合云三者的關系有些類似互聯網、內部網、外部網的關系。由于服務范圍的不同,決定了公有云和私有云之間的區別和特點,數字圖書館建設過程中要從前期投入、部署的靈活性、數據安全、服務質量及穩定性、現有軟硬件資源利用率等方面對采用公有云或者私有云作出一個評判和選擇。
1.前期投入。在前期的投入上來看,公有云具有明顯的優勢。公有云最大的優點是,其所應有的程序,服務及相關數據都存放在公有云的提供者處,圖書館無需做最前期相應的投資和建設,也無需擔心中后期的改進和升級,可以將有限的資金用在更好地為讀者服務中去。
2.部署的靈活性。在部署的靈活性方面私有云比公有云更加具有優勢,私有云的部署靈活性可以從兩個方面來體現:首先是圖書館擁有基礎設施,并可控制在此基礎設施上部署應用程序的方式;其次則是私有云可以由圖書館自身的技術部門來構建,也可以由云提供商進行構建。
3.現有軟硬件資源利用率。圖書館在數字圖書館的建設過程中,都會有很多舊有的服務器設備及信息資源應用。雖然公有云的技術很先進,但其對數字圖書館原有的信息資源應用的兼容性卻不好,而私有云在這方面做得相對不錯,而且私有云可以利用圖書館現有的硬件資源來構建,這樣將會極大地降低數字圖書館的運行成本。
4.數據安全性。數字圖書館使用公有云目前最大的問題是,由于數據不存儲在自身的數據中心內,其安全性存在一定風險。私有云則完全是圖書館單獨構建并使用,因而可實現對數據、安全性和服務可靠性的最有效控制。對于數字圖書館來說,信息數據是其核心,是不能受到任何威脅的,這就決定了圖書館無法將其核心數據及應用放到公有云上運行。私有云可以部署在圖書館數據中心的機房內,也可以被部署在一個安全的主機托管場所。
5.服務質量和穩定性。就目前而言,公有云的服務質量還不確定,比如亞馬遜公有云服務網絡就曾經一個月斷網兩次,公有云宕機對數字圖書館造成的影響不言而喻。私有云的部署一般在本地機房中,而不是在某一個遙遠的數據中心,所以當圖書館讀者訪問那些基于私有云的信息資源應用時,其服務質量相對非常穩定,不會受到互聯網不穩定的影響。
四、動態優化的數字圖書館數據存儲
云計算、虛擬化等概念的出現極大地沖擊了現有數字圖書館的數據存儲體系,數據存儲的需求開始添加新的元素,這導致傳統的數據存儲模式已經無法適應新條件下的數據存儲的需求,對于簡單的通過性能、容量的提升來滿足數據存儲需求的傳統模式來說,越來越難以掌控全局。最終,擺在云時代數字圖書館面前的問題是:一方面,不得不面對現有數據存儲問題朝縱深化發展,現有的存儲系統和管理體系已經難以為繼;另一方面,則是云存儲、虛擬化、異構數據等概念又對數據存儲提出了新的要求和挑戰。
因此,當前所面臨的情況要求云時代數字圖書館必須改變傳統的數據存儲體系,從機械、復雜的數據存儲模式,摒棄改變具有明顯弊端的傳統存儲系統和管理模式,走向動態優化的數據存儲,這將是未來虛擬化、自動化的云數據存儲發展趨勢。首先需要明確的是,動態優化的數據存儲不僅僅是軟件和管理策略的制定,在新的數據存儲理念和發展趨勢下,數據存儲開始融合軟件、硬件、軟件功能、管理策略、硬件平臺的特性以及功能,才能成為一個完整的數據存儲體系,無論是磁盤整列或者是整個存儲網絡,任何為了讓數據更高效的存儲、利用和保護的系統,都包括在新的數據存儲體系之內。因此,從這個角度來說,動態優化的數據存儲體系不僅僅是強大的軟件和管理能力的體現,同時也是包括在一套智能的、消除了管理風險的體系下,實現了軟件和硬件相結合,利用硬件特性和優勢更好的、更智能的數據存儲的過程。從另一個角度來說,動態優化的數據存儲體系可以消除硬件投資成本與數據存儲需求之間的矛盾。其目的是:以合理的成本,將正確的數據,放在最合適的存儲位置上,這其中的含義包括創建一條高效的數據存儲優化之路,提供業務敏捷性、服務水平管理以及經濟節省,并向未來數字圖書館存儲系統及云計算應用模式提供良好的擴展能力??傊?,動態優化的數據存儲目前已經成為趨勢,動態優化的數據存儲目前可以概括為五點:第一是通過智能存儲管理方法來幫助使用者分析和優化數據管理;第二是動態優化的數據存儲包括軟件應用、管理策略和硬件平臺;第三是自動化,與虛擬環境集成,按策略自動遷移并能輕松找到數據;第四是優化,拋棄傳統存儲架構,提供更好的SAN、可驗證的數據保護;第五則是無縫擴展,按需購買,并為將來升級存儲和云計算模式提供無縫擴展能力。有報告表明,目前大部分的存儲預算,都將投入到增加虛擬化使用、信息安全計劃、改善數據備份和恢復、升級網絡基礎設施等云計算技術下的動態優化數據存儲上來,其目的是實現更為智能、高效和可靠的數據存儲。
云計算將數字圖書館的數據存儲帶入一個新的時代,其存儲技術是數字圖書館數據存儲的變革性突破。云計算為數字圖書館的建設提供了一個更加簡單、廉價的數據存儲模式,隨著計算技術的日趨成熟完善,不斷解決云計算在應用過程中遇到的問題,才能使云計算技術在數字圖書館數據存儲中發揮更大的價值。
參考文獻:
[1]杜海寧.基于云計算的圖書館海量數據存儲研究[J].圖書與情報,2010,(3):99-101.
[2]陶蕾.“云”下的圖書館網絡存儲探討[J].圖書館學研究,2010,(07):66-70.
[3]彭駿.基于云計算的圖書館數字資源保障連研究[J].大學圖書情報學刊,2010,(8):49-52.
[4]樓宏青.高校數字圖書館信息管理和存儲策略[J].圖書館論壇,2006,(12):132-136.
[5]張葉紅.云中漫步:圖書館云計算應用[J].農業圖書情報學刊,2010,(12):211-214.
[6]龍文.云時代數字圖書館的抉擇——公有云、私有云與傳統數據中心[J].中國教育信息化,2011,(19):9-10.
作者簡介:龍文(1981-),男,2004年畢業于鄭州輕工業學院,本科,就職于信陽師范學院圖書館,館員,主要從事數字圖書館研究,已發表論文數篇。