范敏
〔摘 要〕云計算技術作為一門新興技術已經強勢進入了圖書館領域,為圖書館的發展迎來了下一個春天。文章歸納了云計算在圖書館中的應用現狀,并且從云計算的含義、特點、服務類型出發,討論了云計算在數字圖書館中的主要應用,指出了數字圖書館應用云計算要考慮的一些瓶頸問題。
〔關鍵詞〕云計算;數字圖書館;云計算應用
DOI:10.3969/j.issn.1008-0821.2012.02.037
〔中圖分類號〕G250.252 〔文獻標識碼〕A 〔文章編號〕1008-0821(2012)02-0147-04
The Application of Cloud Computing on Digital Library
and Its Bottleneck ProblemsFan Min
(Faculty of Computer and Information Science,Southwest University,Chongqing 400715,China)
〔Abstract〕As a new techology, cloud computing has strongly entered into the library field and has welcomed the next spring of the library餾 development.This paper summarized the cloud computing餾 present situation of the application on the library field,and then from the cloud computing餾 meaning,features and service type,discussed its main applications on digital library,pointed out some bottleneck problems on its application.
〔Key words〕cloud computing;digital library;cloud computing applications
1 引 言
1.1 研究背景
“云計算”這個概念自2007年正式提出來以后,一直受到IT界的廣泛討論,其來勢之猛烈大有席卷全球的趨勢,因此很多企業都將自己的業務與其聯系起來,紛紛掛著一個“云”的稱號。Google、亞馬遜、IBM、甲骨文、微軟等IT巨頭都加入了云計算的行列,推出了一些云計算服務,如亞馬遜的網絡服務、Google的幫企業托管服務、微軟的軟件加服務、IBM的藍云計劃。數字圖書館與IT技術的發展有直接的聯系,而云計算技術作為IT界的一種新興技術,它在圖書館行業的發展現狀是怎樣的呢?它是怎樣應用于數字圖書館的建設中的呢?圖書館應用云計算技術又存在著怎樣的限制問題呢?伴隨著云計算的發展,這些問題也逐漸受到了圖書情報界學者的廣泛關注,引起了學術界的另一次研究熱潮。
1.2 國內外研究現狀
基于云計算的服務是從2009年正式引入了圖書館的,目前,國外已經有很多圖書館在使用云計算技術進行圖書館管理與服務。
2009年,邁克爾·斯蒂芬對云計算在圖書館的應用做了初步展望,不久又將云計算列入2009年圖情十大技術之首[1];2009年4月23日,世界最大的聯機圖書館服務供應商OCLC宣布即將推出基于WorldCat書目數據的“Web 級協作型圖書館管理服務”,被公認為是一項云計算服務,其目標是取代各類型圖書館的集成管理系統[2];俄亥俄州圖書館與信息合作網正在使用亞馬遜的云計算服務托管一小部分數字公共資源;哥倫比亞區公共圖書館正在使用亞馬遜的彈性計算云服務托管它們的網站,并且還在使用亞馬遜的S3服務備份圖書館集成系統。
在國內方面,對于云計算在數字圖書館中的研究還處于起步階段,但也有一些理論研究成果和應用實例,并且受到了學術界的重視。從云計算引入到圖書館以來,“云書館”、“云館員”、“云服務”這樣的術語就紛紛出現了。2009年,在華中科技大學舉行了第六屆數字環境下圖書館前沿問題研討會,對云計算給予了高度關注;CALIS(中國高等教育文獻保障系統)基于“十五”成果和三期建設目標,結合云計算、SaaS、Web2.0、SOA等技術,提出了CALIS云戰略和相應的數字圖書館云服務平臺模型[3]。
在發表論文數量方面,筆者以CNKI為數據源,以“云計算”和“圖書館”為關鍵詞,共檢索出相關文獻176篇,時間跨度為2009-2011年。其中,2009年只檢索出1篇文獻,其它均分布在2010年和2011年。可見,從2009年圖書館引進云計算的思想以來,云計算受到圖書館界的廣泛關注。
1.3 研究意義
云計算作為信息時代的產物,是IT行業的新趨勢,受到各行各業的關注。云計算的誕生給IT界帶來了一次新的技術革命,同時也成功地引入到了圖書館界。云計算能夠解決數字圖書館的建設過程中的許多問題,如海量信息的存儲問題、數字資源建設和共享問題。本文主要是從云計算的概念和特點出發,對云計算在數字圖書館中的應用進行歸納,找出數字圖書館應用云計算過程中遇到的問題。
2 云計算概述
2.1 云計算的概念
云計算出現的時間還不長,其定義到目前尚未統一,Matrix已經總結了云計算的20個定義。李開復將云計算定義為:以公開的標準和服務為基礎,以互聯網為中心,提供安全、快速、便捷的數據存儲和網絡計算服務,讓互聯網這片‘云成為每一個網民的數據中心和計算中心[1]。維基百科將云計算(Cloud Computing)定義為:云計算是一種基于互聯網的計算方式,通過這種方式,共享的軟硬件資源和信息可以按需提供給計算機和其他設備[4]。
目前比較普遍的定義是,云計算是并行計算、分布式計算和風格計算的發展,或者說是這些計算機科學概念的商業實現,是虛擬化、效用計算、基礎設施即服務、平臺即服務、軟件即服務等概念混合演進并躍升的結果[5]。在圖書情報界一般引用這個概念。
2012年2月第32卷第2期云計算在數字圖書館中的應用與瓶頸問題Feb.,2.2 云計算的特點
云計算的特點可以歸納為以下幾個方面:①硬件和軟件都是資源,即把所有IT資源均當成服務來提供,包括應用程序、存儲空間、計算能力、編程與運行環境、網絡通信設施、協作工具平臺等,可以認為這是SOA(以服務為導向)的高級階段和具體實施(大多數SOA還只體現在設計階段)[6];②云計算使用了數據多副本容錯、計算節點同構可互換等措施來保障服務,存儲數據安全可靠;③用戶可以根據自己的需求定制或刪減相應的服務,按實際使用量付費,并且用戶可以使用各種終端獲取應用服務;④云計算的資源可以根據應用和用戶規模增長的需要隨時進行動態擴展和配置,具有動態性;⑤云計算支持數據共享,符合權限的用戶只要利用自己的電子設備連接上網,便可同時訪問和使用同一份數據;⑤性價比很高[7]。
2.3 云計算的服務類型
云計算的服務有3個層次:應用層、平臺層和基礎設施層。根據不同的服務層次,可將云計算服務分為3類,即軟件即服務(SaaS)、平臺即服務(PaaS)、基礎設施即服務(IaaS)[8]。
2.3.1 軟件即服務(SaaS)
軟件即服務,即把軟件當作一種服務。用戶無需購買和安裝軟件,而是通過瀏覽器將用戶請求的軟件傳給用戶。這樣,用戶就可以節省大量購買軟件的成本,而服務器提供商也只需維護一個程序,降低了維護成本。應用的主要領域有人力資源管理程序和ERP等。
2.3.2 平臺即服務(PaaS)
平臺即服務,即將開發環境的平臺作為一種服務,包括應用設計、應用開發、應用測試和應用托管,提供給用戶。用戶就可以在此基礎上,開發自己所需要的應用服務。這種服務實際上是SaaS的一個變種,因此也具有SaaS節約成本和便于維護的優點。目前典型的實例有微軟的Windows Azure平臺、Google AppEngine等。
2.3.3 基礎設施即服務(IaaS)
基礎設施即服務,即是將IT的基礎設施(虛擬服務器、存儲、網絡、㊣/O設備整合成的虛擬資源池)作為一種服務,用戶就可以從這些基礎設施中獲得應用所需要的存儲和計算能力,而無需支付這些基礎設施所付出的相應的原始成本。
典型的實例是Amazon的AWS服務,包括Elastic Compute Cloud(EC2)提供的虛擬機租用服務,Simple Storage Service(S3)提供的存儲租用服務等[9]。
3 云計算技術在數字圖書館中的應用
3.1 數字資源存儲
數字圖書館往往面對的是海量的信息,而對這些海量信息進行存儲是數字圖書館必須要解決的一個問題。傳統的數字圖書館常用的海量信息存儲設備主要是光盤塔、磁帶庫、磁盤陣列,網絡附加存儲設備主要有DAS、NAS、SAN,而這些設備的壽命都是有限的,而且會花費大量的圖書館經費。從數字圖書館的角度來看,云計算為用戶提供的基礎設施即服務有望為數字圖書館解決海量信息存儲和數字資源長期保存問題。
云計算的虛擬存儲技術能夠把圖書館使用的DAS、NAS、SAN存儲設備匯集成一個“虛擬存儲池”,數字圖書館的音頻、視頻、圖片、文字等各種格式的數據存放在這個“虛擬存儲池”中,所有基于網絡的RAID、分布式㊣/O、數據冗余、硬盤組、邏輯卷、動態的多個路徑、分層存儲、在線的高速備份等有關的問題都由虛擬存儲管理系統來處理,實現了無縫的存儲和數據管理[10]。有了這樣的存儲系統為保障,就可以實現數據的安全存儲,防止因系統故障而引起的數據損壞與丟失等現象。
另外,還有一些學者從其它的角度對云計算在數字資源存儲的應用進行了闡述。一些學者認為,各個機構獨立開展數字資源保存研究和平臺建設,往往會面臨系統間互操作性差、異構應用的平臺、缺乏共同的標準、非彈性計算能力等問題,而云計算所提供的服務,則有助于使各個圖書館共同協作努力,促使數字資源的保存形成必要的、節約型的數字管理經濟規模[11]。
3.2 數字資源建設
我國的數字圖書館在資源建設方面還存在著諸多問題,如同一圖書館中數字資源不能和紙質資源進行相互補充,不同圖書館之間的數字資源相互獨立、重復建設概率高[12]。部分數字圖書館下的成員館內部缺乏統一的標準,系統兼容性差,一些成員館則各自為政,對數字信息的建設和處理缺乏協調和合作,從而導致數字資源重復建設,造成了資源建設成本和維護成本的浪費。
云計算技術的出現使數字圖書館在網絡中以“信息超市”的形式出現。每個圖書館所有的數字化信息部分或者全部上傳到云空間,由云來統一調度、組織這些海量數據,實現一種標準模式下的互補鏈接,使得整合后的信息更加有序[13]。這樣就既可以巧妙地避免各個圖書館各自為政,造成數字資源的重復建設,又可以解決館內缺乏統一標準而造成系統兼容性差的問題。另外,云計算技術使各個圖書館在數字信息資源建設上實現有效分工,節約出大量的人力、財力,從而可以提升數字圖書館的服務效益,使圖書館能夠集中精力處理核心業務。
3.3 資源共享
3.3.1 硬件環境共享
傳統數字圖書館的硬件環境建設需要購置性能強勁且價格昂貴的大型機,并且需要一定區域內數字圖書館的各個成員館重復購置硬件,這在一定的程度上會增加區域圖書館硬件資源環境建設的經濟負擔。而云計算提供的基礎設施即服務,可以實現區域范圍內的數字圖書館共享其提供的虛擬服務器、存儲、網絡等虛擬資源,即一定區域的數字圖書館通過采用大規模分布式任務處理技術和虛擬化技術,將地理位置不相鄰的多個功能相同的設備虛擬化成一個個塊服務器,多個塊服務器構成一個邏輯上的服務器集群,對外提供簡潔統一的資源服務訪問方式。這種基于云計算的數字圖書館硬件共享方式可以使區域范圍內的成員圖書館通過區域數字圖書館的主服務器來請求資源的調用,來實現硬件資源的共享。
基于云計算的區域數字圖書館硬件環境建設具有以下的一些優點:①對硬件的性能要求低,它可以架構在大規模的廉價服務器集群之上;②支持硬件建設的共建共享,云計算支持數字圖書館對所需購置的硬件進行統一規劃、共同搭建、統一管理,從而為系統內部提供可靠的IaaS服務;③減少資源閑置,提高了硬件服務的并發數量和可靠性;④硬件設備在邏輯上高度集中,方便了系統管理人員對硬件設備的使用和服務管理[14]。
3.3.2 信息資源共享
傳統的數字圖書館的共享機制需要借助于文獻傳遞來進行,這在一定的程度上會產生一定的延遲,給用戶帶來了諸多不便。在云計算的模式下,各個數字圖書館可以將自己的資源上傳至云中的服務器,構建一個巨大的共享信息庫。因此,各個數字圖書館既可以通過網絡共享其它數字圖書館的信息,而不用管這個數字圖書館的具體位置,同時也可以同時獲取許多網絡中本身存在的大量有用信息,極大程度上滿足了用戶的信息需求。在這種情況下,用戶只需要明確自己的信息需求,通過一個簡單的網頁搜索就可以獲取所有加入云中的數字圖書館的信息,讓用戶感覺到好像只使用了一個數字圖書館。這種基于云計算的數字圖書館將異構分布環境下不同來源的海量數據資源進行統一整合,實現信息資源的智能共享,極大地提高數字圖書館資源的利用效率[15]。
3.4 個性化信息服務
云計算本身也就是一種服務,前面提到的幾種云計算在數字圖書館中的應用實際上也就是云計算提供的各種服務。除了這些基礎服務以外,云計算還能為用戶提供個性化的信息服務。個性化的服務是一種用戶驅動的、可定制的信息服務,它是根據用戶的知識結構、信息需求、行為方式和心理傾向等,有的放矢地為具體用戶創造符合個性需求和服務環境,為其提供定向化的預定信息與服務[16]。
云計算的出現豐富了數字圖書館用戶的個性化服務方式,真正可以實現“用戶主導型”的服務,主要表現在以下幾個方面:在終端的選擇上,傳統的數字圖書館只能通過計算機訪問圖書館的資源,而云計算技術支持各種手持式設備,如掌上電腦、智能手機等終端訪問圖書館,真正讓用戶感覺得到“圖書館無處不在”的體驗;用戶交互上,云計算能提供即時通訊和在線幫助或智能數字圖書館機器人的交互,同時可以開放多種Web2.0的服務方式,如維基百科、用戶博客、威客等[17];可以采用多維數據分析挖掘技術,分析用戶的信息行為,挖掘出用戶感興趣的話題,并主動向用戶推送符合用戶需求的信息資源,如RSS技術在圖書館中的應用,可以幫助讀者訂閱自己感興趣的資源,并將這些信息的更新動態即時推送給讀者。
4 數字圖書館應用云計算的瓶頸問題
云計算的理念和服務技術的快速發展,已經被用戶廣泛所接受,并且成為了數字圖書館發展的現實需要。然而,云計算還處于初級使用階段,存在著許多的問題亟待解決。因此,在數字圖書館的建設過程中,圖書館員在利用云計算的便利的同時,還得從圖書館自身角度來考慮云計算的使用將會帶來的瓶頸問題,如信息安全問題、資源的選擇性整合問題、知識產權問題等。
4.1 信息安全問題
數字資源是數字圖書館的靈魂,因而這些數字信息的安全對于數字圖書館來說是至關重要的。每一個數字圖書館的用戶對數字圖書館信息的完整性、可用性、真實性有較高的要求。雖然云計算提供了很強的數據備份能力,能夠保證數字圖書館信息的物理形態的安全性,但對于信息的內容安全性方面還不能保證,仍存在著一些安全性問題:非法用戶利用系統的漏洞得到一些信息后,會對數字圖書館中的其他用戶的個人隱私、重要機密信息等造成威脅;一些非法的操作,可能導致數字資源的丟失;數字圖書館對本館數據的存儲位置并不明確,因而不知道如何對不同用戶的私有數據進行有效隔離、保密,使得數字圖書館用戶不能確定托管于云服務提供商的數據擁有的完全權限;對于涉密信息,如果得不到嚴格加密,數據丟失將會造成嚴重的損失[5,18]。因而對于數字圖書館來說,必須考慮到這些安全性因素,對于一些重要的信息最好能夠利用自己的設備進行備份。
4.2 資源選擇性整合問題
數字圖書館在將數字資源上傳至云中構建云計算資源時,還得考慮數字資源的選擇性整合問題,例如,是否將全部數字資源都上傳至云服務器?如果不是全部上傳,那又應該將哪些資源上傳?在理論上,數字圖書館將資源上傳至云中,可通過本地互聯網進行使用。而實際上,數字圖書館往往不會將全部資源放在云中,而是將一些重要的私密性資源保存在本地計算機,或者在本地進行備份。這樣,當云中服務器出現故障時,能夠繼續在本地處理事務和數據[19]。因此,云計算模式并不會完全推翻數字圖書館現在有部署模式,而是在保留原有模式的基礎上,使現有的部署模式與云計算模式進行融合,作為現有部署模式的有效補充[20]。
4.3 知識產權問題
云計算加大了數字圖書館的信息共享的程度,同時也帶來了版權糾紛問題。如OCLC在2008年11月推出“WordCat”記錄使用與傳遞政策,試圖取代20年前的“OCLC衍生記錄使用與傳遞指南”時,受到很大的質疑,最終不得不在2009年5月宣布撤銷,推倒重來[21]。
數字圖書館要運用云計算技術,必須保證在將自己的資源交給云托管后,完全擁有被托管資源的知識產權,能夠自主管理和控制這些資源,同時其它的用戶沒有權限對這些資源進行管理。然而,云計算企業往往會利用這些數據,并以數據整合、數據挖掘、知識服務的名義努力使用戶數據利用合法化。因此,數字圖書館想要將云計算技術運用自如,就得針對這些版權糾紛,制定出切實可行的方案,完善相關的法律體系,從根本上解決版權問題。
5 結 論
綜上所述,云計算技術作為IT行業的新興發展領域,目前已經成功地引入到了圖書館領域,并且能夠為數字圖書館解決一些現實問題和提供新的服務理念,如幫助數字圖書館解決海量信息的長期保存、信息資源建設等問題,同時能讓數字圖書館共享云中的硬件環境,加大數字圖書館信息資源共享的程度,豐富數字圖書館的個性化用戶服務方式。然而,數字圖書館在利用云計算的過程中,還有一些問題是不得不考慮的,如信息安全問題、資源選擇性整合問題、知識產權問題等。雖然目前云計算技術在數字圖書館的應用還處于探索的階段,相信隨著云計算在其它領域發展的逐漸成熟,將來一定會為圖書館帶來一次偉大的變革。
參考文獻
[1]范并思.云計算與圖書館:為云計算研究辯護[J].圖書情報工作,2009,(53):5-9.
[2]吳雷,張淑芬,劉建生.云時代與數字圖書館.重慶圖情研究[J],2010,(3):45-48.
[3]王文清,陳凌.CALIS數字圖書館云服務平臺模型[J].大學圖書館學報,2009,(4):13-18.
[4]http:∥zh.wikipedia.org/wiki/%E4%BA%91%E8%AE%A1%E7%AE%97[EB].
[5]史慶艷.云計算對數字圖書館的影響[J].情報探索,2010,(8):19-21.
[6]劉煒.圖書館需要一朵怎樣的“云”[J].大學圖書館學報,2009,(4):2-6.
[7]高曉燕.云計算在圖書館中的應用研究[J].大學圖書情報學刊,2010,(28):60-62.
[8]張鵬程,許曉魯.云計算策略、服務與解決方案[J].軟件產業與工程,2011,(2):40-45.
[9]Amazon Web Services[EB].http:∥aws.amazon.corn/.
[10]康健明.虛擬存儲技術及其在數字圖書館中的應用[J].圖書館論壇,2007,(27):92-94.
[11]陶新權,孫青,王亞,等.云計算在圖書館中的應用[J].大學圖書館學報,2010,(2):54-57.
[12]盧曉娟.云計算與未來圖書館數字信息資源建設[J].四川圖書館學報,2009,(2):23-24.
[13]王長宇.云計算環境下的數字圖書館信息資源建設的理性思考[J].中國科技信息,2010,(17):163-165.
[14]汪曉囡.基于云計算的區域數字圖書館研究[J].數字圖書館論壇,2010,(11):63-70.
[15]王平.云計算關鍵技術在數字圖書館中的應用研究[J].情報資料工作,2010,(5):52-56.
[16]李惠琴.基于“云計算”的數字圖書館服務模式[J].圖書館論壇,2010,(31):209-210.
[17]周舒,張嵐嵐.云計算改善數字圖書館用戶體驗初探[J].圖書館學研究,2009,(4):28-30.
[18]孫文乾.淺析云計算的安全策略[J].電腦知識與技術,2010,(9):2145-2146.
[19]饒少陽.向“云”計算靠攏[J].電信之窗,2008,(7):5-10.
[20]蔡炳育,陳慧賢.云計算與數字資源存儲問題分析[J].巢湖學院學報,2009,(6):27-30.
[21]胡小菁,范并思.云計算給圖書館管理帶來挑戰[J].大學圖書館學報,2009,(4):7-12.